CN1630731A - 鉴定驯化的植物和动物中进化上显著的多核苷酸和多肽序列改变的方法 - Google Patents

鉴定驯化的植物和动物中进化上显著的多核苷酸和多肽序列改变的方法 Download PDF

Info

Publication number
CN1630731A
CN1630731A CNA038048477A CN03804847A CN1630731A CN 1630731 A CN1630731 A CN 1630731A CN A038048477 A CNA038048477 A CN A038048477A CN 03804847 A CN03804847 A CN 03804847A CN 1630731 A CN1630731 A CN 1630731A
Authority
CN
China
Prior art keywords
seq
polynucleotide
sequence
polypeptide
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038048477A
Other languages
English (en)
Inventor
W·梅西尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evolutionary Genomics LLC
Original Assignee
Evolutionary Genomics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/079,042 external-priority patent/US7252966B2/en
Application filed by Evolutionary Genomics LLC filed Critical Evolutionary Genomics LLC
Publication of CN1630731A publication Critical patent/CN1630731A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供用于鉴定可能与驯化植物或动物中 商业或美学相关性状有关的多核苷酸和多肽序列的方法。这些 方法利用来自驯化生物与其祖先的同源基因的比较,鉴定进化 上显著的改变和进化中性的改变。这样鉴定的序列可用于增强 驯化生物或其野生祖先中商业或美学上希望的性状。

Description

鉴定驯化的植物和动物中进化上显著的 多核苷酸和多肽序列改变的方法
技术领域
本发明涉及使用分子及进化技术鉴定驯化的(domesticated)植物和动物中对应于商业或美学相关性状的多核苷酸和多肽序列。
背景技术
人类繁育植物和动物已经有几千年的历史,选择某些有商业价值的和/或美学性状。驯化的植物在如下性状上不同于其野生祖先:产量、短日照开花、蛋白质和/或油含量、易于收获、味道、抗病性和抗旱性。驯化的动物在如下性状上不同于其野生祖先:脂肪和/或蛋白质含量、产奶量、温顺性、生殖力和成熟时间。目前,导致上述差异的大多数基因还不清楚,重要的是,在这些基因中进化提供这些能力的具体改变也不清楚。了解驯化的植物和动物与其野生祖先之间的不同将为保持并提高这些性状提供有用的信息。对于作物,鉴定控制希望的性状的具体基因将能够用以前不可能的方式直接、快速地改良。
尽管驯化的种与其野生祖先之间同源基因或蛋白质的比较可以提供关于 保守分子序列和功能特征的有用信息,但是该方法有限地用于鉴定由于人类施加选择压力其序列发生改变的基因。随着高级算法和分析方法的出现,能够从DNA序列改变中得出关于哪些基因阳性选择的更多信息。这些方法中最有效的是“KA/KS”,包括两两比较以下列比值排比的蛋白质编码核苷酸序列:
每个非同义位点的非同义核苷酸置换(KA)/每个同义位点的同义置换(KS)
(其中非同义是指改变编码的氨基酸的置换,同义是指不改变编码的氨基酸的置换)。“KA/KS型方法”包括这种方法及类似的方法。
已经用这些方法证明了达尔文(即自然)分子水平阳性选择的发生,在同源蛋白质中产生氨基酸差异。几个研究小组已经使用这些方法证明,一种具体蛋白质的进化比中性置换率更快,从而支持了达尔文分子水平阳性选择的存在。例如,McDonald和Kreitman(1991)Nature 351:652-654提出了对中性蛋白质进化假说的一种统计学检验,它是根据基因座编码区中氨基酸替代置换数量与同义置换数量的比较。当对三个果蝇种的Adh基因座进行这种检验时,它们的结论是,该基因座已经经受在选择上有利的突变的适应固定(adaptivefixation),适应突变的选择性固定可能是中性突变的有规律积累的一种可能的备选途径,可解释大多数蛋白质进化。Jenkins等人(1995)Proc.R.Soc.Lond.B 261:203-207使用McDonald & Kreitman检验来研究控制转录的序列(非编码序列)中是否发生适应进化。
Nakashima等人(1995)Proc.Natl.Acad.Sci USA 92:5606-5609使用Miyata和Yasunaga的方法对来自两个蛇种的10种PLA2同功酶基因的核苷酸序列进行两两比较;该方法包括比较非编码区(包括内含子(KN)和KA和KS)每个位点的核苷酸置换的数量。它们的结论是,蛋白质编码区以高于非编码区(包括内含子)的速度进化。这种高度加速的置换速度引起PLA2同功酶基因的达尔文分子水平的进化,产生新的生理活性,必将在捕获猎物或防御捕食者方面提供强选择优势。Endo等人(1996)Mol.Biol.Evol.13(5):685-690采用Nei和Gojobori的方法,其中dN是非同义置换的数量,dS是同义置换的数量,旨在证明基因的自然选择。Metz和Palumbi(1996)Mol.Biol.Evol.13(2):397-406采用McDonald和Kreitman(同上)检验以及属于Nei和Gojobori、Nei和Jin以及Kumar、Tamura和Nei的方法;检查Pn(每个替代位点的替代置换)和PS(每个沉默位点的沉默置换)的平均比例,以寻找海胆结合基因的阳性选择的证据,研究它们是否已经快速进化,作为种形成的前奏。Goodwin等人(1996)Mol.Biol.Evol.13(2):346-358利用类似的方法检查了一个具体鼠基因家族的进化,结论是,该方法允许重要地基本了解在实验操作系统中选择如何推动遗传分歧。Edwards等人(1995)使用简并引物从多个鸟种和鳄鱼种中扩增MHC基因座,然后利用Nei和Gojobori的方法分析(dN∶dS比),从而将MHC研究扩展到非哺乳类脊椎动物。Whitfield等人(1993)Nature364:713-715利用KA/KS分析寻找SRY基因(决定雄性性别)中位于保守区侧翼的区域中的定向选择。它们建议,SRY的快速进化可能是生殖隔离的一个重要原因,产生新的种。Wettsetin等人(1996)Mol.Biol.Evol.13(1):56-66使用Kumar,Tamura和Nei的MEGA程序和系统发生分析来研究松鼠和有关啮齿动物中MHC I类基因的多样化。Parham和Ohta(1996)Science 272:67-74宣称,分析人类MHC I类多态性的产生和保持需要使用一种群体生物学方法,包括检测选择以及基因转化和中性漂变。Hughes(1997)Mol.Biol.Evol.14(1):1-5比较了人类与啮齿动物之间超过100种直向同源(Orthologous)免疫球蛋白C2域,利用Nei和Gojobori的方法(dN∶dS比)检验脊椎动物免疫系统细胞中表达的蛋白质通常快速进化这一假说。Swanson和Vacquier(1998)Science 281:710-712使用dN∶dS比证明溶素与溶素卵受体之间一致的进化,并讨论这种一致进化在形成新种(物种形成)中的作用。Messier和Stewart(1997)Nature 385:151-154使用kA∶kS比证明灵长类动物溶菌酶中的阳性选择。
已经在玉蜀黍(玉米的优选农业术语)中广泛研究了与驯化有关的遗传改变(Dorweiler(1993)Science 262:232-235)。对于玉米(玉蜀黍Zea mays ssp.mays),有少量单基因改变清楚地说明了现在的驯化玉米植物与其野生祖先玉米草(teosinte)(Zea mays ssp paruiglumis)之间的所有差异(Dorweiler,1993)。QTL(定量性状基因座)分析证明(Doebley(1990)PNAS USA 87:9888-9892),仅有15种基因控制玉米的目的性状,并解释玉米与玉米草之间形态学的重要差异(Wang(1999)Nature398:236-239)。
重要的是,类似的少量基因可以控制其它草衍生的作物(包括水稻、小麦、粟和高粱)的目的性状(Paterson(1995)Science269:1714-1718)。实际上,对于玉米中的大多数相关基因,同源基因可以控制其它草衍生的作物中的类似性状(Paterson,1995)。因此,在一种草衍生的作物中鉴定这些基因将有助于鉴定其它所有作物中的同源基因。
从上述文章中可以看出,用于鉴定快速进化基因的分子进化分析方法(KA/KS型方法)能够用来实现许多不同的目的,最常见的是证实达尔文分子水平阳性选择的存在,以及评价达尔文分子水平阳性选择的频率,阐明新种形成的机制,或者建立具体基因多态性的一个或多个来源。从上述文章和其它文献中可以清楚地看到,没有作者使用KA/KS型方法鉴定通过人工选择压力产生的驯化植物和动物中的进化改变。Turcich等人(1996)Sexual Plant Reproduction 9:65-74描述了KS分析对于植物基因的用途,据信没有人使用KA/KS型分析作为一种系统工具来鉴定驯化植物和动物中含有具进化上显著的序列改变的基因,这些基因能够用于希望的商业或美学性状的发展、保持或提高。
在驯化的种中鉴定已经进化,与同源祖先基因相比提供独特、增强的或改变的功能的基因,能够用来开发调节这些功能的试剂。鉴定已经进化的驯化种基因和具体核苷酸改变,以及进一步表征这些进化基因编码的蛋白质的物理和生物化学改变,能够提供关于希望的性状的机制的有价值信息。这种有价值的信息能够用来发展可进一步增强靶蛋白质功能的试剂。此外,有关基因的进一步改造能够修饰或增强希望的性状。另外,也发现鉴定的基因在控制其它驯化植物的目的性状中起作用。一种类似的方法能够鉴定驯化动物的目的性状的基因。
此处引用的所有参考文献均在此全文引用作为参考。
发明内容
本发明涉及鉴定驯化植物或动物中控制有商业价值的性状的多核苷酸的方法。根据本发明的方法,发现控制有商业价值的性状的这些多核苷酸,能够用来进一步增强这些性状。鉴定为控制有商业价值的性状(如抗旱性,抗病性或应激抗性或产量,蛋白质含量,短日照开花,含油量,易于收获,味道等)的多核苷酸,能够用来开发进一步提高驯化植物的商业价值的组合物和方法。虽然希望鉴定控制有价值的性状的多核苷酸,但是在植物和动物基因组的上万个基因中鉴定这些多核苷酸是具有挑战性的。本发明包括使这些多核苷酸的搜索范围变窄,方法是比较驯化生物与祖先生物的相应多核苷酸序列,选择那些含有具进化上显著的核苷酸改变的序列,一般显示为Ka/Ks比=1.0或更高。例如,Ka/Ks比=1.0的祖先-现代植物多核苷酸对的亚组应当含有受中性进化影响的多核苷酸,即该性状的保守或改变未处于人类或自然施加的压力下。然后能够检测编码如抗旱性、抗病性或应激抗性等性状的多核苷酸,因为驯化显著补充了这些功能,缓解了这些多核苷酸的自然选择压力。Ka/Ks比大于1.0的祖先-现代植物多核苷酸对的亚组应当含有受选择影响的多核苷酸。然后能够检测编码如产量、蛋白质含量、短日照开花、含油量、易于收获、味道等性状的多核苷酸,因为这些性状在植物(如作物)驯化过程中已经处于人类施加的强烈、单向、不断的选择压力下。
因此,在一个实施方案中,本发明提供如下方法,用于鉴定含有进化上显著的改变的多核苷酸和多肽序列,它们与驯化生物(包括植物和动物)的商业或美学性状有关。本发明利用比较基因组学鉴定可能与结构、生物化学或生理条件有关(因此负责)的具体基因改变,如商业或美学相关的性状,并且利用由这些多核苷酸或多肽序列获得的信息发展目的性状增强的驯化生物。
在一个优选实施方案中,驯化植物或动物的一种多核苷酸或多肽经受人工选择,产生在驯化种中存在而在野生祖先中不存在的进化上显著的改变。这种实施方案的一个例子是,该多核苷酸或多肽可能与作物产量比祖先提高有关。其它例子包括短日照开花(即只在每日日照少于一定的临界时间长度时才开花)、蛋白质含量、含油量、易于收获和味道。因此本发明能够用来了解驯化生物中功能或性状的基因和/或分子机制。该信息能够用于设计多核苷酸,以便进一步增强功能或性状。例如,确定为负责作物产量提高的一种多核苷酸能够进行随机或定向诱变,随后检测突变基因,鉴定进一步提高性状的基因。
因此,一方面,提供鉴定编码驯化生物(例如植物或动物)的一种多肽的多核苷酸序列的方法,其中该多肽可能与一种商业或美学相关的性状有关,与驯化生物的祖先相比,该性状在驯化生物中是独特、增强或改变的,该方法包括下列步骤:a)比较该驯化生物的蛋白质编码核苷酸序列与该野生祖先的蛋白质编码核苷酸序列;和b)选择驯化生物中的一种多核苷酸序列,与野生祖先的相应序列相比,其含有一个核苷酸改变,其中这种改变具有进化意义。
在本发明的另一方面,提供鉴定驯化生物(例如植物或动物)的蛋白质编码核苷酸序列中进化上显著的改变的方法,包括下列步骤:a)比较驯化生物的蛋白质编码核苷酸序列与驯化生物的野生祖先的相应序列;b)选择该驯化生物中的一种苷酸序列,与野生祖先的相应序列相比,其含有一个核苷酸改变,其中这种改变具有进化意义。
在一些实施方案中,利用此处所述的任何方法鉴定的核苷酸改变是非同义置换。在有些实施方案中,根据核苷酸序列的非同义置换率(KA)确定核苷酸改变的进化意义。在有些实施方案中,通过测定驯化生物多核苷酸与相应祖先多核苷酸之间的KA/KS比,评价进化上显著的改变。在有些这样的实施方案中,优选地该比值至少约为0.75,或者更优选地为1.0。随着偏性提高,该比值至少约为1.0、1.25、1.50、2.00或更高。
另一方面,本发明提供一种方法,用于鉴定可调节驯化生物的有关性状的试剂,该方法包括使至少一种候选试剂接触一种细胞、模型系统或转基因植物或动物,后者表达含有进化上显著的改变的多核苷酸序列,或者接触含有进化上显著的多肽的组合物,其中根据其调节多肽的功能或合成的能力鉴定该试剂。
也提供一种方法,用于驯化生物的蛋白质编码核苷酸序列与野生祖先的蛋白质编码序列之间的大规模序列比较,该方法包括:a)根据序列同源性排比驯化生物序列与来自野生祖先的相应序列;b)鉴定驯化生物序列内与来自野生祖先生物的同源序列相比的任何核苷酸改变。
另一方面,本发明提供一种方法,用于将进化上显著的核苷酸改变与驯化生物中独特、增强或改变的商业或美学相关性状相关联,该方法包括:a)根据此处所述的方法鉴定含有进化上显著的改变的核苷酸序列;b)分析驯化生物或模型系统中含有或不含鉴定的序列的功能效应。
这些方法中使用的驯化植物可以是玉米、水稻、西红柿、马铃薯或现存或知道其野生祖先的任何驯化植物。例如,玉米的祖先是玉米草(Zea mays parviglumis);小麦的祖先是单粒小麦(Triticummonococcum)、T.speltoides和Aegilops tauschii;水稻的祖先是O.rufipogon。相关性状可以是任何商业或美学相关的性状,如产量、短日照开花、蛋白质含量、含油量、抗旱性、味道、易于收获或抗病性。在一个优选实施方案中,驯化的植物是水稻,相关性状是产量。
在本发明的另一个实施方案中,提供了鉴定祖先生物中与应激抗性有关的多核苷酸的方法。在这一实施方案中,与祖先的多核苷酸相比,驯化生物的一种多核苷酸经历中性进化,该多核苷酸与或者可能与应激抗性有关,籍此突变在驯化生物的多核苷酸中累积。相对于驯化生物,祖先的应激抗性性状可能是独特、增强或改变的。
鉴定多核苷酸序列的方法包括:a)比较驯化生物的多肽编码核苷酸序列与野生祖先的多肽编码核苷酸序列;b)选择祖先生物中的一种多核苷酸序列,与驯化生物的相应序列相比,其含有至少一个核苷酸改变,其中这种改变是进化中性的。应激抗性性状可以是抗旱性、抗病性、抗虫性、高盐水平抗性或商业上重要的其它应激抗性性状。
也提供一种方法,用于鉴定驯化生物的野生祖先的多肽编码多核苷酸序列中的进化中性改变,该方法包括:a)比较该野生祖先的多肽编码多核苷酸序列与该驯化生物的相应序列;b)选择驯化生物中的一种多核苷酸序列,与野生祖先的相应序列相比,其含有一个核苷酸改变,其中这种改变是进化中性的,该多核苷酸与野生祖先的应激抗性性状有关。
中性进化一般表示为KA/KS比为约0.75-1.25,更优选地约0.9-1.1,最优选地约1.0。KA/KS比较可以计算为祖先对驯化生物,或驯化生物对祖先生物。
另一方面,本发明提供一种方法,用于鉴定可调节一种生物(祖先或驯化生物)的应激抗性性状的试剂,其中至少一种候选试剂接触祖先、驯化生物或表达与应激抗性有关的多核苷酸序列的细胞或转基因生物,其中根据调节多核苷酸编码的多肽的功能的能力鉴定该试剂。
也提供一种方法,用于野生祖先与驯化生物的多肽编码核苷酸序列之间的大规模序列比较,其中该祖先多肽提供或者可能提供一种与应激有关的性状,与驯化生物相比,该性状在野生祖先中是独特、增强或改变的,该方法包括:a)根据序列同源性排比祖先与驯化的序列,和b)鉴定驯化生物序列中与祖先同源序列相比的任何核苷酸改变,其中这种改变是进化中性的。
另一方面,本发明提供一种方法,用于将一种进化中性的核苷酸改变与驯化生物中独特、增强或改变的商业或美学相关性状相关联,该方法包括:a)根据此处所述的方法鉴定含有进化中性改变的核苷酸序列;和b)分析驯化生物中或模型系统中含有或不含鉴定的序列的功能效应。
附图简述
图1显示稻(O.sativa)cv.Nipponbare与O.rufipogon(NSGC5953)的EG307的核苷酸排比。该排比包括5’端的非翻译区(UTR),注意该基因的起始与终止密码子。
图2显示稻cv.Nipponbare与O.rufipogon(NSGC5953)的EG307的蛋白质排比。该排比包括整个编码(CDS)区。
图3显示Zea mays mays和Zea mays parviglumis(玉米草,Benz967株)中EG307的基因编码区的核苷酸序列。鉴定了起始与终止密码子。
图4显示Zea mays mays和Zea mays parviglumis EG307的蛋白质排比。该排比包括推断的全长蛋白质序列。
图5显示对5种不同遗传水稻图谱作图的标记CDO1387和RZ672,表明这些标记的范围在5个图谱中一致。EG307位于CDO1387的上游(约200kb),1000粒重的QTL与标记RZ672有关。
图6显示稻(Nipponbare株)与O.rufigogon(5498株)的EG117的核苷酸排比,显示有三个非同义改变。
图7显示稻(Nipponbare株)与O.rufigogon(5498株)的EG117的蛋白质排比。该排比包括含有终止密码子的部分CDS区。稻与O.rufipogon的三个氨基酸差异以黑体表示。
图8显示稻(Nipponbare株)与拟南芥(Araidopsis)PTR2-B(组氨酸转运蛋白,NP178313)的蛋白质排比。
发明详述
在一个实施方案中,本发明使用比较基因组学鉴定驯化生物(例如植物和动物)中阳性选择的基因,和与商业或美学相关性状有关、因此可能有助于或导致该性状的具体基因改变。
在另一个实施方案中,本发明鉴定驯化生物的祖先中的进化中性基因和与应激抗性有关的基因改变。
除非另外说明,本发明的实施使用属于本领域技术的常规分子生物学、遗传学和分子进化技术。这些技术在如下文献中充分说明:《分子克隆:实验室手册》,第二版(Sambrook等人,1989);《寡核苷酸合成》(M.J.Gait编著,1984);《现代分子生物学方法》(F.M.Ausubel等人编著,1987);《PCR:聚合酶链反应》(Mullis等人编著,1994);《分子进化》(Li,1997)。
I.定义
如此处所用的“多核苷酸”是指任何长度的核苷酸的聚合形式,是核糖核苷酸或脱氧核糖核苷酸,或其类似物。该术语是指分子的一级结构,因此包括双链和单链DNA,以及双链和单链RNA。也包括修饰的多核苷酸,如甲基化和/或加帽的多核苷酸,含有修饰碱基、主链修饰的多核苷酸等。术语“多核苷酸”和“核苷酸序列”可以互换使用。
如此处所用的“基因”是指含有编码一种蛋白质的序列的多核苷酸或多核苷酸部分。在本领域公知,基因也含有非编码序列,如5′和3′侧翼序列(如启动子、增强子、抑制子和其它调节序列)以及内含子。
术语“多肽”、“肽”和“蛋白质”在此可以互换使用,是指任何长度的氨基酸的聚合物。这些术语也包括通过包括糖基化、乙酰化和磷酸化在内的反应在翻译后修饰的蛋白质。
术语“驯化的生物”是指经受人工选择压力并发展商业或美学相关性状的活生物个体或其群体、种、亚种、变种、栽培种或株。在一些优选实施方案中,驯化的生物是选自玉米、小麦、水稻、高粱、西红柿或马铃薯的植物,或有商业意义的其它任何驯化植物,其祖先已知。“植物”是处于任何发育阶段的任何植物,特别是种子植物。
在其它优选实施方案中,驯化的生物是选自牛、马、猪、猫和狗的动物。驯化的生物及其祖先可能涉及不同种、亚种、变种、品种或株,或其任意组合。
术语“野生祖先”或“祖先”是指进化出驯化生物、种、亚种、变种、栽培种或株的前代生物、种、亚种、变种、栽培种或株。一种驯化的生物能够有一个或一个以上的祖先。一般而言,驯化的植物能够有一个或多个祖先,而驯化的动物通常只有一个祖先。
术语“商业或美学相关性状”在此用来指驯化生物(如植物或动物)中存在的性状,对它们的分析能够提供关于发展改良生物或能够调节负责该性状的多肽或各自多核苷酸的试剂的信息(例如物理或生物化学数据)。相对于祖先,商业或美学相关性状可能是独特、增强或改变的。“改变的”是指相关性状在性质上和数量上不同于祖先中的性状。
术语“KA/KS型方法”是指评价同源基因中非同义置换与同义置换之间的差异的方法,通常(但不总是)显示为一个比值(包括确定非同义和同义位点的更严格的方法)。这些方法使用几种命名体系命名,包括但不限于KA/KS、dN/dS、DN/DS
术语“进化上显著的改变”和“适应性进化改变”是指两种生物、种、亚种、变种、栽培种和/或株之间的一个或多个核苷酸或肽序列改变,这可能是由于选择压力或阳性选择压力的减轻。测定是否存在进化上显著的改变的一种方法是使用KA/KS型分析法,如测定KA/KS比。一般而言,KA/KS比为1.0或更高被认为是进化上显著的改变。
严格地说,KA/KS比恰好等于1.0表示选择压力减轻(中性进化),KA/KS比大于1.0表示阳性选择。然而,通常认为GenBank和其它公开数据库中的ESTs常常有一定程度的测序错误,甚至有少数不正确的核苷酸能够影响KA/KS比。由于这个原因,KA/KS比低至0.75的多核苷酸可以仔细地重新测序,重新评价选择压力(有中性进化意义的改变)、阳性选择压力(有阳性进化意义的改变)或阴性选择压力(进化上保守的改变)的减轻。
术语“有阳性进化意义的改变”是指具体生物、种、亚种、变种、栽培种或株中进化上显著的改变,与其它有关生物相比,产生阳性的适应改变。有阳性进化意义的改变的一个例子是导致作物产量提高的改变。如上所述,KA/KS比大于1.0表示阳性选择。随着偏性增加,KA/KS值大于1.25、1.5和2.0。
术语“有中性进化意义的改变”是指一种多核苷酸或多肽改变,相对于祖先生物,其在驯化的生物中出现,在中性条件下发展。中性进化改变的证据是KA/KS值约为0.75-1.25,优选地约0.9-1.1,最优选地等于约1.0。同样,在中性进化的情况下,推断没有“方向性”。该基因没有限制地自由积累改变,因此祖先和驯化形式彼此改变。
术语“抗性”是指,优选地与非抗性生物相比时,一种生物显示避免或减少疾病和/或疾病发展程度的能力。
术语“敏感性”是指,优选地与已知为抗性的生物相比时,一种生物不能避免或减少疾病和/或疾病发展的程度。
众所周知,抗性和敏感性在个体之间不同,对于本发明,这些术语也用于一个种内的一组个体,抗性与敏感性的比较通常总指种间差异,尽管也可以进行种内的比较。野生亲缘生物的分类是可以改变的。因此,如果分类改变,以分类为基础的种差异可能变为种内差异。
术语“应激抗性”是指抵抗干旱、疾病、害虫(包括但不限于昆虫、食草动物和微生物)、高盐水平和其它内部或外部不利刺激的能力,这些刺激倾向于破坏植物稳态,如果不加校正可能导致紊乱、疾病或死亡。
术语“同源的”或“同源物”或“直向同源物(ortholog)”在本领域公知,是指具有同一个祖先的有关序列,根据序列同一性程度测定。这些术语描述在一个种、亚种、变种、栽培种或株中发现的基因与另一个种、亚种、变种、栽培种或株中的相应或相当的基因之间的关系。对于本发明,同源序列进行比较。“同源序列”或“同源物”或“直向同源物”被认为或者已知是功能相关的。功能关系可以用大量方式中的任何一种表示,包括但不限于:(a)序列同一性程度;(b)相同或相似的生物功能。优选地,(a)和(b)都使用。序列同一性程度可能不同,但是优选地至少50%(当使用本领域公知的标准序列排比程度时),更优选地至少60%,更优选地至少约75%,更优选地至少约85%。同源性能够用本领域易于获得的软件程序测定,如《现代分子生物学方法》(F.M.Ausubel等人编著,1987)Supplement 30,7.718节,表7.71所述。优选的排比程序是MacVector(Oxford Molecular Ltd,Oxford,U.K.)和ALIGN Plus(Scientific and Educational Software,Pennsylvania)。另一种优选的排比程序是Sequencher(Gene Codes,Ann Arbor,Michigan),使用缺省参数。
术语“核苷酸改变”是指本领域公知的核苷酸置换、缺失和/或插入。
“看家基因”是本领域公知的一个术语,是指与普通细胞功能有关的基因,功能包括但不限于:生长、分裂、停滞、新陈代谢和/或死亡。“看家”基因通常行使在一种以上的细胞型中发现的功能。相反,细胞特异的基因通常在一种特定细胞型和/或类别中行使功能。
如此处所用的术语“试剂”是指生物或化学化合物,如简单或复杂的有机或无机分子、肽、蛋白质或寡核苷酸,其调节多核苷酸或多肽的功能。能够合成一大批化合物,例如寡聚体,如寡肽和寡核苷酸,和以不同核心结构为基础合成的有机和无机化合物,它们也包括于术语“试剂”之内。另外,许多自然来源能够提供化合物进行筛选,如植物或动物提取物等。化合物能够单独检测或互相组合检测。
术语“调节一种多核苷酸或多肽的功能”是指与不添加试剂相比,该多核苷酸或多肽的功能改变。调节可以在影响功能的任何水平上发生。一种多核苷酸或多肽的功能可能是直接或间接的,直接或间接地测定。
“多核苷酸的功能”包括但不限于:复制;翻译;表达模式。多核苷酸的功能也包括与该多核苷酸内编码的一种多肽有关的功能。例如,一种试剂,其作用于一种多核苷酸,并影响蛋白质的表达、构象、折叠(或其它物理特征)、与其它部分(如配体)的结合、活性(或其它功能特征)、调节和/或蛋白质结构或功能的其它方面,被认为是具有调节的多核苷酸功能。
“多肽的功能”包括但不限于:构象、折叠(或其它物理特征)、与其它部分(如配体)结合、活性(或其它功能特征)和/或蛋白质结构或功能的其它方面。例如,一种试剂,其作用于一种多肽,并影响其构象、折叠(或其它物理特征)、与其它部分(如配体)的结合、活性(或其它功能特征)和/或蛋白质结构或功能的其它方面,被认为是具有调节的多肽功能。一种有效试剂能够用来调节多肽功能的方式包括但不限于:
1)改变构象、折叠或其它物理特征;2)改变与其自然配体的结合强度,或改变与配体结合的特异性;和3)改变多肽的活性。
术语“靶位点”是指多肽中的一个位点,它可以是单氨基酸,和/或是结构和/或功能基序的一部分,例如结合位点、二聚化结构域或催化活性部位。靶位点可用于与一种试剂(如治疗剂)直接或间接相互作用。
术语“分子差异”包括任何结构和/或功能差异。检测这些差异的方法,以及这些差异的例子,在此描述。
“功能效应”是本领域公知的一个术语,是指在任何活性水平上直接或间接显示的任何效应。
术语“易于收获”是指为了消费或其它商业加工,有利于手工或自动化收集结构或部分(例如果实、叶、根)的植物特性或特征。
术语“产量”是指人类可以获得的用于食物、治疗、兽医或其它市场的植物或动物组织或材料的量。
术语“提高的经济生产力”是指为了改进希望的特征,调节商业或美学相关性状的能力。提高的产量和增强的应激抗性是提高的经济生产力的两个例子。
II.本领域公知的一般方法
对于本发明,来自驯化植物或动物或其祖先的多核苷酸的来源可以是任何合适的来源,例如基因组序列或cDNA序列。优选地比较cDNA序列。蛋白质编码序列能够获自可以获得的私人、公开和/或商业数据库,如此处所述的。这些数据库作为进行研究产生的分子序列数据的仓库(repositories)。此外,蛋白质编码序列也可以获自,例如,根据本领域公知的方法测序由细胞中表达的mRNA反转录的cDNA,或PCR扩增。此外,基因组序列也可用于序列比较。在PCR后,基因组序列能够获自可以获得的公开、私人和/或商业数据库,或者来自基因组DNA文库的测序或基因组DNA。
在有些实施方案中,cDNA由mRNA制备,该mRNA获自处于确定的发育阶段的组织,或在生物经历某些环境条件后获得的组织。本发明的序列比较使用的cDNA文库能够用常规cDNA文库构建技术构建,这些技术在本领域的文献中充分说明。总mRNA用作反转录cDNA的模板。将转录的cDNA亚克隆到适当载体中,建立一个cDNA文库。建立的cDNA文库能够对全长cDNA含量最大化,尽管也可以使用小于全长的cDNA。此外,例如,也能够根据Bonaldo等人(1996)Genome Research 6:791-806所述标准化序列频率。从构建的cDNA文库中随机选择的cDNA克隆能够用标准自动化测序技术测序。优选地,用全长cDNA克隆进行测序。可以测序来自cDNA文库的全部或大部分克隆,但是也能够通过测序仅仅单个cDNA或几个cDNA克隆实施本发明的某些实施方案。
在本发明的一个优选实施方案中,将要测序的cDNA克隆能够根据其表达特异性预先筛选。为了筛选对应于特异表达的活性基因的cDNA,能够使用从同一动物的其它器官、组织或细胞中获得的mRNA对cDNA进行扣减杂交。在适当严格性和浓度的特定杂交条件下,与非组织特异性mRNA杂交、因而可能代表“看家”基因的那些cDNA将从cDNA库中排除。因此,将要测序的剩余的cDNA更可能与组织特异的功能有关。对于扣减杂交,非组织特异性mRNA能够获自一种器官,或者优选地获自不同器官和细胞的组合。为了饱和组织特异性cDNA,使非组织特异性mRNA的含量最大化。
此外,也能够利用来自联机数据库的信息筛选或优先考虑更可能与具体功能有关的cDNA。例如,使用根据候选驯化生物cDNA序列设计的引物,通过PCR,能够选择祖先cDNA候选物进行测序。候选驯化生物的cDNA序列是,例如,只在具体组织(如骨骼肌)中发现的,或者对应于在具体功能中可能重要的基因。这些组织特异性cDNA序列可以通过搜索联机序列数据库获得,其中可能说明了关于cDNA序列的表达谱和/或生物活性的信息。
已知驯化生物基因的祖先同源物的序列可以用本领域的标准方法获得,如PCR方法(例如使用GeneAmp PCR System 9700热循环仪(Applied Biosystems,Inc.))。例如,使用根据候选驯化生物cDNA序列设计的引物,通过PCR,能够选择用于测序的祖先cDNA候选物。对于PCR,可以利用本领域的标准方法,包括可以公开获得的引物设计程序,如PRIMER_(Whitehead Institute),由驯化生物的序列制备引物。扩增的祖先序列然后可以用本领域的标准方法和仪器测序,如自动测序仪(Applied Biosystems,Inc.)。同样,也能够利用祖先基因模拟物获得驯化生物中的相应基因。
III.驯化生物中阳性选择的多核苷酸的鉴定
在一个优选实施方案中,此处所述的方法能够用来鉴定农业上重要的驯化植物中控制目的性状的基因。人类繁育驯化植物已经有几千年的历史,但是不知道控制这些性状的基因。对有关具体遗传机制的了解将允许在分子水平上更快速、直接地干预,产生具有希望的或增强的性状的植物。
人类通过人工选择对作物施加了强大的选择压力。这种压力反映在驯化生物与其野生祖先的同源基因之间进化上显著的改变上。已经发现,只有少数基因,例如每个种10-15个基因,控制驯化作物中具有商业意义的性状。这些少数基因通过植物分子生物学的标准方法非常难以鉴定。此处所述的KA/KS和有关分析能够鉴定控制目的性状的基因。
对于任何目的作物,cDNA文库能够由驯化的种或亚种及其野生祖先构建。如1999年1月29日提交的USSN09/240,915所述,每个cDNA文库互相“BLAST搜索”,以鉴定同源多核苷酸。此外,技术人员也能够获取可以商品和/或公开获得的基因组或cDNA数据库,而不是构建cDNA文库。
其次,进行KA/KS或有关分析,鉴定在选择压力下快速进化的选择的基因。然后用标准分子和转基因植物方法评价这些基因,来确定它们在商业或美学目的性状中是否起作用。然后通过例如随机或定点诱变操作目的基因,发展新的、改良的变种、亚种、株或栽培种。
本发明的一般方法如下。简言之,从驯化生物和野生祖先中获得核苷酸序列。驯化生物和祖先的核苷酸序列互相比较,鉴定同源序列。分析同源序列,鉴定在驯化生物与祖先之间具有核酸序列差异的序列。然后进行分子进化分析,定量及定性地估计这些差异的进化意义。对于阳性选择的基因,能够进行外类群分析,以鉴定在驯化生物中(或在祖先中)阳性选择的基因。然后,在分子/遗传同一性和生物学功能方面表征该序列。最后,能够利用这些信息鉴定能够调节该基因编码的多肽的生物功能的试剂。
本发明的普通方法需要比较祖先与驯化生物的蛋白质编码核苷酸序列。比较利用生物信息学,选择含有核苷酸改变(进化上显著的改变)的序列。本发明能够鉴定已经进化提供某些进化优势的基因,以及鉴定特定进化的改变。在一个优选实施方案中,驯化的生物是稻(Oryzasativa),野生祖先是Oryza rufipogon。对于本发明,通过标准测序技术从O.rufipogon克隆中获得蛋白质编码核苷酸序列。
比较驯化生物及其祖先的蛋白质编码序列,鉴定同源序列。本发明涉及完成这种比较的所有适当的机制。排比可以手工进行,也可以用软件进行(本领域公知合适的排比程序的实例)。优选地,通过数据库搜索,例如BLAST搜索,比较来自祖先的蛋白质编码序列与驯化种的序列。高得分“命中”,即在BLAST分析后显示显著相似性的序列,将获得(retrieved)并分析。显示显著相似性的序列可能是具有至少约60%、至少约75%、至少约80%、至少约85%或者至少约90%序列同一性的序列。优选地,进一步分析显示高于约80%同一性的序列。通过数据库搜索鉴定的同源序列能够用本领域公知且可以获得的序列排比方法和程序完整排比,如Higgins等人(1992)CABIOS8:189-191的常用的简单排比程序CLUSTAL V。
本发明提供一种方法,用于鉴定编码驯化生物的一种多肽的多核苷酸序列,其中与其野生祖先相比,该多肽与或者可能与该驯化生物的产量提高有关,该方法包括:a)比较该驯化生物的多肽编码核苷酸序列与该野生祖先的多肽编码核苷酸序列;和b)选择驯化生物中的一种多核苷酸序列,与野生祖先中的相应序列相比,该序列含有一个核苷酸改变,其中这种改变是有进化意义的,从而鉴定驯化生物的多核苷酸序列。在一个优选实施方案中,与产量提高有关的多肽是一种EG307多肽。
在这种情况下,例如,从O.rufipogon中获得的核苷酸序列作为查询(query)序列,在GenBank中搜索稻ESTs,用来鉴定同源序列。应当指出,不需要完整的蛋白质编码核苷酸序列。实际上,可以比较部分cDNA序列。一旦通过下述方法鉴定目的序列,即能够用其它克隆和/或生物信息学方法获得目的基因或蛋白质的整个编码序列。
此外,驯化生物与其祖先之间蛋白质编码序列的测序和同源性比较也可以用新发展的测序芯片技术同时进行。参见,例如,Rava等人美国专利5,545,531。
分析排比的驯化生物与祖先的蛋白质编码序列,鉴定具体位点的核苷酸序列差异。另外,本发明也涉及实现这一分析的任何适当的方法。如果没有核苷酸序列差异,通常不会进一步分析祖先蛋白质编码序列。最初通常且优选地检查检测的序列改变的精确性。优选地,最初的检查包括进行下列一个或多个步骤,这些步骤均在本领域公知:(a)发现祖先与驯化生物序列之间发生变化的点;(b)核对序列荧光图(色谱),确定祖先或驯化生物特有的碱基是否对应于所述碱基特异的强烈、清楚的信号;(c)核对驯化生物的命中,发现是否有一个以上的驯化生物序列对应于序列改变。同一基因的多个驯化生物序列在一个位点处含有相同的核苷酸,而在祖先序列的该位点处含有一个不同的核苷酸,这独立地支持该驯化序列是准确的,该改变是重要的。这些改变用数据库信息和遗传密码检查,确定这些核苷酸序列改变是否导致编码蛋白质的氨基酸序列的改变。如“核苷酸改变”的定义所述,本发明包括,与来自祖先的相应序列相比,驯化生物的蛋白质编码多核苷酸序列中的至少一个核苷酸改变,它是置换、缺失或插入。优选地,这种改变是一种核苷酸置换。更优选地,在鉴定的序列中存在一个以上的置换,并且进行分子进化分析。
能够利用几种不同的分子进化分析或KA/KS型方法定量及定性地评价驯化种基因序列与相应祖先的基因序列之间鉴定的核苷酸改变的进化意义。Kreitman和Akashi(1995)Annu.Rev.Ecol.Syst.26:403-422;Li,《分子进化》,Sinauer Associates,Sunderland,MA,1997。例如,通过两两比较每个非同义位点的非同义核苷酸置换(KA)与每个同义位点的同义置换(KS)之比,能够在蛋白质编码基因中检测蛋白质的阳性选择(即分子水平的适应性进化)(Li等人,1985;Li,1993)。可以使用KA与KS的任何比较,尽管以比值比较这两个变量是特别方便且最有效的。通过用标准统计学方法显示KA与KS之间统计学显著的差异,鉴定这些序列。
对于本发明,鉴定来自O.rufipogon和稻的同源序列。一个O.rufipogon克隆,PBI0307H9的序列(SEQ ID NO:31)与GenBank中稻的序列的比较,显示高KA/KS比。为了获得完整的基因,即EG307,进行几个不同稻株的进一步克隆和PCR,使得完整的基因序列能够进行KA/KS分析。这些方法在实施例10中详述。O.rufipogon中EG307的完整序列(SEQ ID NO:28)和稻cv.Nipponbare1的完整序列(SEQID NO:25)在图1中显示。相应的蛋白质序列,SEQ ID NO:30和SEQID NO:27,在图2中显示。KA/KS比的概述在实施例11的表1中显示。由于O.rufipogon与驯化株杂交繁育,某些株更类似于O.rufipogon。某些株的高KA/KS比表示进化上显著的改变。
优选地,利用Li等人的KA/KS分析计算机程序实施本发明,尽管也能使用能够检测种间阳性选择的基因的其它分析程序。Li等人(1985)Mol.Biol.Evol.2:150-174;Li(1993),参见J Mol.Evol.36:96-99;Messier和Stewart(1997)Nature 385:151-154;Nei(1987)《分子进化遗传学》(New York,Columbia University Press)。KA/KS方法,包括根据比值比较基因的同源蛋白质编码区之间每个非同义位点的非同义置换率与每个同义位点的同义置换率,用来鉴定进化过程中适应选择或中性选择可能引起的序列置换。同义(“沉默”)置换是,由于遗传密码的简并性,使得编码的氨基酸序列不变;非同义置换导致氨基酸替代。每种类型的改变的程度能够分别估计为KA和KS,每个非同义位点的非同义置换数和每个同义位点的同义置换数。KA/KS的计算可以手工进行,也可以利用软件进行。合适的程序的一个例子是MEGA(Molecular Genetics Institute,Pennsylvania State University)。
为了估计KA和KS,利用完整的或部分蛋白质编码序列计算同义和非同义置换以及非同义和同义位点的总数。分析的多核苷酸序列的长度可以是任何合适的长度。优选地,为了测定全部显著改变,比较整个编码序列。可公开获得的计算机程序,如Li93(Li(1993)J.Mol.Evol.36:96-99)或INA,能够为所有的两两比较计算KA和KS值。这种分析能够进一步适于以“滑动窗口(sliding window)”方式检查序列,使得少量的重要改变不被整个序列所掩盖。“滑动窗口”是指基因的连续、重叠的亚部分的检查(亚部分可以是任何长度)。
例如,鉴定的基因EG307的滑动窗口KA/KS分析显示,与O.rufipogon相比,在许多稻株的EG307的5’端有大量非同义改变。在所有株中,该基因的3’端具有低比值。这些方法和结果在实施例11和表2-7中详述。
非同义与同义置换率的比较用KA/KS比表示。KA/KS反映适应性进化在研究的序列中起作用的程度。编码序列的全长或部分片段能够进行KA/KS分析。KA/KS比越高,序列经历适应性进化、非同义置换进化上显著的可能性越大。参见,例如,Messier和Stewart(1997)。优选地,KA/KS比至少约0.75,更优选地至少约1.0,更优选地至少约1.25,更优选地至少约1.50,或者更优选地至少约2.00。优选地,对所有升高的KA/KS比进行统计学分析,包括但不限于标准方法,如Yang(1998)Mol.Biol Evol.37:441-456所述的Student t-检验和似然比检验。
为了两两比较同源序列,KA/KS比显著高于一致性强烈提示,阳性选择已经比仅仅由于偶然所能预期的固定了更多的氨基酸置换,这与该比值低于1的常见模式不同。Nei(1987);Hughes和Hei(1988)Nature 335:167-170;Messier和Stewart(1994)Current Biol.4:911-913;Kreitman和Akashi(1995)Ann.Rev.Ecol.Syst.26:403-422;Messier和Stewart(1997)。比值低于1通常表示阴性或纯化选择的作用:对保持不变的功能性有效蛋白质的一级结构有强大压力。比值约等于1表明在中性条件下进化。
对于来自祖先和驯化生物的同源基因的蛋白质编码区,所有计算KA/KS比的方法都是基于每个非同义位点的非同义置换数与每个同义位点的同义置换数的两两比较。每种方法对估计的“多个命中”(即同一位点处一个以上的核苷酸置换)进行不同的校正。每种方法也使用DNA序列在进化时间内如何改变的不同模型。因此,优选地,利用不同算法得出的组合结果提高检测阳性选择的基因的灵敏度水平和结果的置信度。
优选地,应当计算直向同源基因对的KA/KS比,与共生同源基因对不同(即特种形成产生的基因,不同于基因复制产生的基因)。Messier和Stewart(1997)。通过与其它祖先进行另外的比较,可以发现这种差别,这允许建立系统进化树。当直向同源基因用来建立进化树时,将产生公知的“物种树”,即,将产生恢复已知的生物学树的树。相反,共生同源基因将产生干扰已知的生物学树的树。
应当理解,此处所述的方法能够鉴定与蛋白质编码序列在功能上相关的祖先或驯化生物的多核苷酸序列。这些序列可包括但不限于非编码序列或不编码蛋白质的编码序列。例如,这些相关序列能够在物理上邻近基因组中的蛋白质编码序列,如内含子或5’-和3’-侧翼序列(包括控制元件,如启动子和增强子)。这些相关序列可以如下获得:搜索可以获得的公开、私人和/或商业基因组数据库,或者另外,用蛋白质编码序列作为探针筛查生物的基因组文库并测序。本领域技术人员公知利用相关编码序列获得非编码序列的方法和技术。
通过分子进化分析(如KA/KS分析)检测的进化上显著的核苷酸改变,能够进一步评价它们在驯化生物中的独特出现或这些改变在驯化生物中的独特程度。例如,能够检测在与驯化生物具有共同祖先的相关种、亚种或其它生物的其它序列中是否存在驯化基因中鉴定的改变。这种比较(“外类群分析”)允许测定阳性选择的基因在所述驯化生物中是否阳性选择(不同于祖先)。
例如,在EG307基因中鉴定的改变在大量稻株中不同程度地鉴定。参见表2-7。另外,EG307的对应物也在玉米,Zea mays mays,其野生祖先,玉米草,Zea mays parviglumis以及玉米的野生亲缘Z.diploperennis和Z.luxurians中鉴定。参见实施例13和表9。水稻和玉米中的EG307在核苷酸水平上略有不同,但是蛋白质序列比较相似。发现水稻和玉米是由它们的野生祖先独立驯化的,显示一致的模式:与祖先植物(玉米草或祖先水稻)相比,现代作物(玉米或水稻)中的大多数氨基酸置换导致电荷/极性增加、溶解度提高、疏水性降低。这种模式最不可能在这两个独立驯化事件中偶然发生。这提示,这些置换是对人类进行的驯化的相似反应。这有力地证实了由于人类对这两种谷物的驯化,EG307已经被选择。
驯化生物与其祖先之间含有至少一个进化上显著的改变的序列能够作为引物,进行其它祖先蛋白质编码序列的PCR分析,测序产生的多核苷酸,观察在其它祖先中是否存在同一改变。这些比较允许进一步辨别,与其它祖先相比,适应进化改变是否是驯化谱系唯一的,以及与驯化种和其它祖先相比,适应改变是否是祖先唯一的。在驯化生物中检测而在其它祖先中检测不到的核苷酸改变更可能代表驯化生物中的适应进化改变。此外,在一个祖先中检测到,而在驯化生物或其它祖先中检测不到的核苷酸改变,可能代表祖先适应进化改变。用于比较的其它祖先能够根据它们与驯化生物的系统发生关系进行选择。这些比较的统计学显著性可以用建立的可以利用的程序测定,例如Messier和Stewart(1997)Nature 385:151-154使用的t-检验。在统计学上显示高KA/KS比的基因极有可能经历适应进化。
含有显著改变的序列能够作为来自不同驯化群体的基因组的探针,来观察一个以上的驯化群体是否共同具有序列改变。来自不同驯化群体的基因序列能够获自数据库,或者由大量无关、多样化驯化群体PCR扩增的DNA的直接测序。在不同驯化群体中存在鉴定的改变进一步表明这些改变的进化重要性。
种间含有显著改变的序列能够使用本领域技术人员公知的方法和技术,在分子/遗传学同一性和生物功能方面进一步表征。例如,利用可公开获得的生物信息学程序,能够将序列遗传学和物理学定位于生物的基因组内。核苷酸序列内新鉴定的显著性改变可能提示该基因在生物进化中的可能的作用,以及与独特、增强或改变的功能的可能的联系。
利用本发明的技术,如实施例10所述发现了一种迄今为止仍不清楚的进化上显著的水稻基因,被称为EG307。如实施例11所述在O.rufipogon与某些稻株之间进行KA/KS分析,表明如表1所示的一个进化上显著的改变。该基因已经阳性选择。使用几种不同的水稻图谱,如实施例12所述,发现EG307在标记RZ672的约10cM以内,RZ672是与染色体3上存在的1000粒重的QTL有关的一种标记。(1000粒重是随机选择的1000个饱满水稻粒的三个不同样品的重量(质量))。这是产量的一种灵敏测量,考虑水稻粒之间存在的重量的个体差异。因此,RZ672标记只有约10%的机会在一代内与EG307分离,强烈提示EG307在控制产量提高方面起重要作用。
也使用本发明的技术,如实施例14详述,发现了一种迄今未知的进化上显著的水稻基因,被称为EG3117。如实施例14所述在O.rufipogon与某些稻株之间进行KA/KS分析,表明如表10所示的一个进化上显著的改变。该基因已经阳性选择。使用几种不同的水稻图谱,如实施例13和14所述,发现EG1117位于与标记RZ672相同的BAC上,RZ672是与染色体3上存在的1000粒重的QTL有关的一种标记。EG1117距EG307约2-3cM。
根据进化上显著的KA/KS值与作图数据的组合,本领域技术人员能够合理地推断出EG307和EG1117是产量相关基因。制备并培育突变体或转基因植物能够容易地证实EG307和EG1117的产量提高功能。备选方法包括使用来自水稻的EG307和EG117序列、来自玉米的EG307和EG117基因的相关分析和系谱分析,其野生祖先如实施例13所述获得。
例如,通过同源物搜索可以进一步表征推断的含有鉴定序列的基因。推断的基因与一种已知基因的共同同源性可以表示相似的生物作用或功能。表征推断的基因序列的另一种典型方法是根据已知的序列基序。已知某些序列模式编码具有特殊生物特征的蛋白质区,如信号序列、DNA结合域或跨膜域。
通过寻找基因在何处组织或细胞型特异地表达,也能进一步评价鉴定的含有显著改变的序列。例如,鉴定的编码序列能够作为探针,进行原位mRNA杂交,这将揭示序列的表达模式。在某些组织中表达的基因可能是与该组织(例如发育的胚乳组织)的重要功能有关的更好候选者。也能确定一个种成员发育的每个阶段中基因表达的时间安排。
作为序列表征的另一种典型方法,通过对转染的驯化生物(例如转基因植物或动物)中一种鉴定的基因的不同等位基因进行功能测定,能够估计含有显著改变的鉴定的核苷酸序列的功能作用。植物功能测定的现有的例子包括使用微阵列,参见Seki等人,使用全长cDNA微阵列在干旱和寒冷应激下监测1300种拟南芥基因的表达模式.Plant Cell13:61-72(2001),和代谢谱,参见Roessner等人,代谢谱允许对遗传或环境修饰的植物系统进行全面的表型分型.Plant Cell13:11-29(2001)。
作为序列表征的另一种典型方法,使用计算机程序可以模建并显示来自驯化生物和祖先的同源蛋白质的三维结构。具体、准确地了解祖先蛋白质中哪些氨基酸被置换,允许检测可能与功能差异有关的结构改变。因此,模建技术的使用与前段所述的功能作用的鉴定密切相关。这些技术的单个或组合使用构成了本发明的部分。
利用本方法鉴定的驯化生物的基因能够用来鉴定具有共同祖先的其它种的同源基因。例如,玉米、水稻、小麦、粟、高粱和其它谷类具有共同的祖先,在水稻中鉴定的基因能够直接产生其它草的同源基因。同样,西红柿和马铃薯具有共同的祖先,利用本方法在西红柿中鉴定的基因预期在马铃薯中有同源物,反之亦然。
本发明也提供一种检测植物细胞中提高产量的基因的方法,包括:
a)在杂交条件下,EG307基因或其长度超过12个核苷酸、优选地超过30个核苷酸的部分接触来自植物细胞的基因组DNA制品,该条件允许检测与选自下列的核酸分子具有约50%或更高序列同一性的核苷酸分子序列:SEQ ID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ IDNO:4,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:59,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:81,SEQ ID NO:82,SEQ ID NO:84,和SEQ ID NO:85;b)检测杂交,由此可鉴定提高产量的基因。
本发明也提供一种从重组植物细胞文库中分离一种产量相关基因的方法,包括:a)提供一种植物细胞DNA制品或重组植物细胞文库;
b)在允许检测具有50%或更高序列同一性的基因杂交条件下,使该制品或植物细胞文库接触一种可检测地标记的EG307保守的寡核苷酸;和c)通过与可检测标记结合,分离一种产量相关基因。
本发明也提供一种从植物细胞DNA中分离一种产量相关基因的方法,包括:a)提供植物细胞DNA样品;b)提供与EG307基因保守区具有序列同源性的一对寡核苷酸;c)在适于聚合酶链反应介导的DNA扩增的条件下,使寡核苷酸对与植物细胞DNA样品结合;d)分离扩增的产量相关基因或其片段。
通过此处所述方法鉴定的序列能够用来鉴定可用于调节驯化生物的独特、增强或改变的功能和/或利用这些序列改正这些能力的缺陷的试剂。例如,这些方法使用本领域公知的筛选技术,如体外系统、基于细胞的表达系统和转基因动物和植物。本发明提供的方法不仅可鉴定快速进化的基因,而且指出能够对蛋白质进行的调节,这些蛋白质因为在其它种中存在,因此毒性可能不会太大。
本发明也提供一种生产EG307多肽的方法,包括:a)提供一种细胞,该细胞用为了在细胞中表达而定位的编码EG307多肽的多核苷酸转染;b)在表达该多核苷酸的条件下培养转染的细胞;和c)分离EG307多肽。
本发明也提供检测植物细胞中产量提高基因的一种方法,包括:
a)在杂交条件下,使长度超过12个核苷酸、优选地超过30个核苷酸的EG307或EG1117基因或其部分接触来自植物细胞的基因组DNA的制品,该条件允许检测与选自下列的核酸分子有大约50%或更高序列同一性的核酸分子序列:SEQ ID NO:92,SEQ ID NO:93,SEQ IDNO:94,SEQ ID NO:96,SEQ ID NO:97,SEQ ID NO:98,SEQ IDNO:100,SEQ ID NO:101,SEQ ID NO:102,SEQ ID NO:103,SEQ IDNO:104,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:107,SEQ IDNO:109,SEQ ID NO:110,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:119,SEQ IDNO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ IDNO:124,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:128,SEQ IDNO:129,SEQ ID NO:130,SEQ ID NO:131,SEQ ID NO:133,SEQ IDNO:135,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:144,SEQ IDNO:145,SEQ ID NO:146,SEQ ID NO:147,SEQ ID NO:149,SEQ IDNO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:154,SEQ IDNO:155,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:160,SEQ IDNO:161,SEQ ID NO:162,SEQ ID NO:163,SEQ ID NO:165,SEQ IDNO:166,SEQ ID NO:167,和SEQ ID NO:168;和b)检测杂交,从而可以鉴定一种提高产量的基因。
本发明也提供从重组植物细胞文库中分离产量相关基因的一种方法,包括:a)提供植物细胞DNA的制剂或重组植物细胞文库;b)在允许检测具有50%或更高序列同一性的基因的杂交条件下,使植物细胞文库制品接触可检测地标记的EG307或EG1117保守寡核苷酸;和c)通过与可检测的植物结合,分离一种产量相关的基因。
本发明也提供从植物细胞DNA中分离产量相关基因的一种方法,包括:a)提供一种植物细胞DNA样品;b)提供与EG307或EG1117基因保守区有序列同源性的一对寡核苷酸;c)在适于聚合酶链反应介导的DNA扩增的条件下,使该寡核苷酸对与植物细胞DNA样品结合;和d)分离扩增的产量相关基因或其片段。
通过此处所述的方法鉴定的序列能够用来鉴定可用于使用这些序列调节驯化生物的独特、增强或改变的功能和/或校正这些能力的缺陷的试剂。这些方法例如使用本领域公知的筛查技术,如体外系统,基于细胞的表达系统和转基因动物和植物。本发明提供的方法不仅可以鉴定快速进化的基因,而且表示能够对蛋白质进行的调节,由于该蛋白质存在于其它种中,因此可能不会太毒。
本发明也提供一种生产EG307或EG1117多肽的方法,包括:a)提供一种细胞,该细胞用为了在细胞中表达而定位的编码一种EG307或EG1117多肽的多核苷酸转染;b)在表达该多核苷酸的条件下培养转染的细胞;和c)分离EG307或EG1117多肽。
A.EG307多肽
本发明的一个实施方案是一种分离的植物EG307多肽。如此处所用的,在一个实施方案中,EG307多肽是与约447个氨基酸的稻多肽有关(即具有结构相似性)的一种多肽,其具有图2所示的序列(SEQ IDNO:6)。实施例中详细描述了最初对这种多肽的鉴定。一种优选的EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与下列至少一种基因杂交:(a)编码稻EG307多肽的基因(即稻基因);(b)编码O.rufipogon EG307多肽的基因(即O.rufipogon基因);(c)编码Zea mays mays EG307基因的基因;(d)编码Zea mays parviglumisEG307多肽的基因(即Z.mays parviglumis基因);(e)编码Zeadiploperennis EG307多肽的基因(即Z.diploperennis基因);和(f)编码Zea luxurians EG307多肽的基因(即Z.luxurians基因)。应当指出,术语“一个”实体是指一个或多个实体;例如,一个基因是指一个或多个基因或至少一个基因。这样,术语“一个”、“一个或多个”和“至少一个”在此能够互换使用。也应当指出,术语“包含”、“包括”和“含有”能够互换使用。
如此处所用的严格杂交条件是指利用多核苷酸(包括寡核苷酸)鉴定具有相似核酸序列的分子的标准杂交条件。这些标准条件例如在Sambrook等人,《分子克隆:实验室手册》,Cold Spring Harbor LabsPress,1989中公开。这些条件的实例在本申请的实施例部分提供。
如此处所用的稻EG307基因包括与天然稻EG307基因有关的所有核酸序列,如控制该基因编码的稻EG307多肽产生的调节区(例如但不限于转录、翻译或翻译后控制区),以及自身的编码区。在一个实施方案中,稻EG307基因包括核酸序列SEQ ID NO:4。核酸序列SEQ ID NO:4代表cDNA(互补DNA)多核苷酸的推断序列,它的产生在实施方案中公开。应当指出,由于核酸测序技术不会完全没有错误,因此SEQ ID NO:4(以及此处所示的其它序列)最多代表编码本发明的稻EG307多肽的表观核酸序列。
在另一个实施方案中,稻EG307基因可以是一种等位基因变体,包含与SEQ ID NO:4相似但不相同的序列。包含SEQ ID NO:1的稻EG307基因的一种等位基因变体是基因组中的一个基因座,其活性与相同的生物化学或发育过程有关,和/或一种基因,其存在于与包含SEQ ID NO:4的基因基本相同的基因座处,但是,例如由于突变或重组引起的自然变异,含有相似但不相同的序列。因为基因组能够经历重排,等位基因的物理排列不总是相同的。等位基因变体一般编码与相比较的基因编码的多肽活性相似的多肽。等位基因变体在基因的5’或3’非翻译区(例如调节控制区)也能够包含改变。本领域技术人员公知等位基因变体,预期在特定水稻栽培种或株中发现,因为其基因组是二倍体,和/或在群体中包含两个或多个栽培种或株。例如,一般认为下文详述的含有SEQ ID NO:18所示核酸序列的稻多核苷酸代表稻的Kasalath株的等位基因变体。
类似地,一种Zea mays mays EG307基因包含与自然Z.mays maysEG307基因有关的所有核酸序列,如控制该基因编码的Z.mays maysEG307多肽产生的调节区以及其编码区。在一个实施方案中,一种Zeamays mays EG307基因包含核酸序列SEQ ID NO:66。核酸序列SEQID NO:66代表推断的cDNA多核苷酸的序列,它的产生在实施例中公开。在另一个实施方案中,一种Zea mays mays EG307基因可以是一种等位基因变体,其包含与SEQ ID NO:66相似但不相同的序列。
根据本发明,一种分离的或生物纯的多肽是从其天然环境中提取的一种多肽。同样,“分离的”和“生物纯的”不一定反映该多肽纯化的程度。本发明的一种分离的EG307多肽能够从其天然来源中获得,能够用重组DNA技术产生,或者能够通过化学合成产生。本发明的一种EG307多肽可以根据在功能测定中行使天然EG307功能的能力鉴定。“天然EG307多肽”是指稻、O.rufipogon、Z.mays mays和/或Z.mays parviglumis的全长EG307多肽。短语“在功能测定中能够行使天然EG307的功能”是指该多肽在功能测定中具有天然多肽的至少约10%的活性。在其它优选实施方案中,EG307多肽在功能测定中具有天然多肽的至少约20%的活性。在其它优选实施方案中,EG307多肽在功能测定中具有天然多肽的至少约30%的活性。在其它优选实施方案中,EG307多肽在功能测定中具有天然多肽的至少约40%的活性。在其它优选实施方案中,EG307多肽在功能测定中具有天然多肽的至少约50%的活性。在其它优选实施方案中,EG307多肽在功能测定中具有天然多肽的至少约60%的活性。在更优选的实施方案中,EG307多肽在功能测定中至少具有天然多肽的约70%的活性。在更优选的实施方案中,EG307多肽在功能测定中具有天然多肽的至少约80%的活性。在更优选的实施方案中,该多肽在功能测定中具有天然多肽的至少约90%的活性。功能测定的例子包括抗体结合测定或产量提高测定,如本申请书其它部分所详述。
如此处所用的分离的植物EG307多肽可以是一种全长多肽或这种多肽的任何同源物。EG307同源物的例子包括氨基酸已经缺失(例如多肽的截短形式,如肽)、插入、翻转、置换和/或衍生(例如糖基化、磷酸化、乙酰化、肉豆蔻酯化、异戊二烯化(prenylation)、棕榈酰化(palmitoylation)、酰胺化和/或添加甘油磷脂酰肌醇),使得该同源物具有天然EG307活性的EG307多肽。
在一个实施方案中,当使用本领域公知的技术对动物施用该同源物作为一种免疫原时,该动物将产生针对天然EG307多肽的至少一个表位的体液和/或细胞免疫应答。EG307同源物也能够根据它们在功能测定中行使EG307功能的能力选择。
植物EG307多肽同源物可能是自然等位基因变异或自然突变的结果。本发明的EG307多肽同源物也能够应用本领域公知的技术产生,包括但不限于,例如使用经典或重组DNA技术直接修饰多肽或修饰编码多肽的基因,以实现随机或靶向诱变。
根据本发明,模拟表位(mimetope)是指能够模拟分离的本发明的植物EG307多肽在功能测定中行使本发明的EG307多肽功能的能力的任何化合物。模拟表位的例子包括但不限于:抗独特型抗体或其片段,其包含至少一个结合位点,该位点模拟分离的本发明的多肽的一个或多个表位;分离的多肽的非肽免疫原性部分(例如碳水化合物结构);合成或天然有机分子,包括核酸,其结构类似于分离的本发明的多肽的至少一个表位。能够利用计算机产生的本发明的多肽的结构设计这些模拟表位。模拟表位也能够如下获得:产生分子的随机样品,如寡核苷酸、肽或其它有机分子,使用相应的结合配偶体利用亲和层析技术筛选这些样品。
本发明的EG307多肽同源物的最小大小足以由一种多核苷酸编码,该多核苷酸能够与编码相应天然多肽的多核苷酸的互补序列形成稳定的杂合体。因此,编码这种多肽同源物的多核苷酸的大小取决于核酸组成和多核苷酸与互补序列之间的百分同源性,以及杂交条件本身(例如温度、盐浓度和甲酰胺浓度)。应当指出,根据同源序列是散布在整个多核苷酸中还是在多核苷酸的不同区域聚簇(即局部化),形成稳定杂合体所需的同源性程度可能不同。如果这些多核苷酸富含GC,多核苷酸的最小大小一般为至少约12个到约15个核苷酸,如果富含AT,长度至少为约15个到约17个碱基。优选地,多核苷酸的长度至少为12个碱基。
因此,编码本发明的EG307多肽同源物的多核苷酸的最小大小为约12个到约18个核苷酸。除了实践的限制之外,这种多核苷酸的最大大小没有限制,因为该多核苷酸可能包含基因的一部分、整个基因或多个基因或其部分。类似的,本发明的EG307多肽同源物的最小大小为约4个到约6个氨基酸,优选的大小取决于是希望这些多肽的全长、融合、多价还是功能部分。优选地,该多肽的长度至少为30个氨基酸。
任何一种植物EG307多肽都是本发明的合适的多肽。从中分离EG307多肽(包括天然多肽的分离或通过重组或合成技术生产多肽)的合适的植物包括:玉米、小麦、大麦、黑麦、粟、鹰嘴豆、小扁豆、亚麻、橄榄、无花果、杏、开心果、胡桃、甜菜、防风草、柑桔类水果(包括但不限于:桔子、柠檬、酸橙、葡萄柚、红桔、minneola和桔柚)、红薯、菜豆、豌豆、菊苣、莴苣、卷心菜、花椰菜、花茎甘蓝、芜菁、小萝卜、菠菜、芦笋、洋葱、蒜、胡椒、芹菜、倭瓜(squash)、南瓜、大麻、夏南瓜(zucchini)、苹果、梨、榅桲、甜瓜、李子、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉、大豆、西红柿、高粱、甘蔗、甜菜、向日葵、油菜籽、三叶草、烟草、胡萝卜、棉花、紫花苜蓿、水稻、马铃薯、茄子、黄瓜、芥(Arabidopsis),和木本植物,如针叶树和落叶树,水稻和玉米是优选的。从中分离EG307多肽的优选的水稻植物包括Nipponbare 1和2、Lemont、IR64、Teqing、Azucena和稻的Kasalath 1、2、3、4株。
本发明的一种优选的植物EG307多肽是这样一种化合物,当在植物中表达或调节时,能够提高该植物的产量。
本发明的一个实施方案是一种融合多肽,其包含与融合片段连接的含EG307多肽的结构域。包含一个融合片段作为本发明的EG307多肽的一部分能够提高该多肽在生产、贮存和/或使用中的稳定性。根据片段的特征,融合片段也能够作为免疫增强剂,增强用含有这种融合片段的EG307多肽免疫动物引起的免疫应答。此外,融合片段也能够作为简化EG307多肽纯化的工具,例如允许利用亲和层析纯化获得的融合多肽。一种合适的融合片段可以是具有希望的功能(例如,使多肽具有提高的稳定性、提高的免疫原性,和/或简化多肽的纯化)的任何大小的结构域。在本发明的范围内也包括使用一种或多种融合片段。融合片段能够与该多肽的含EG307结构域的氨基端和/或羧基端连接。融合片段与融合多肽的含EG307结构域之间的连接易被切割,这样能够简单地回收这些多肽的含EG307的结构域。融合多肽优选地通过培养一种重组细胞产生,该细胞用编码一种多肽的融合多核苷酸转化,该多肽包含与含EG307结构域的羧基端和/或氨基端连接的融合片段。
在本发明中使用的优选的融合片段包括:谷胱甘肽结合域;金属结合域,如能够与二价金属离子结合的聚组氨酸片段;免疫球蛋白结合域,如多肽A、多肽G、T细胞、B细胞、Fc受体或互补多肽抗体结合域;糖结合域,如来自麦芽糖结合多肽的麦芽糖结合域;和/或“标签”域(例如β-半乳糖苷酶的至少一部分,strep标签肽,能够用可与该结构域结合的化合物(如单克隆抗体)纯化的其它结构域)。更优选的融合片段包括金属结合域,如聚组氨酸片段;麦芽糖结合域;strep标签肽。
本发明优选的植物EG307多肽是水稻EG307多肽和玉米EG307多肽。更优选的EG307多肽是稻、O.rufipogon、Z.mays mays、Zea maysparviglumis、Z.diploperennis和Z luzurians EG307多肽。稻株包括Nipponbare、Azucena、Kasalath 1、2、3和4、Teqing、Lemont和IR64。Z.mays parviglumis株包括Benz、BK4、IA19和Wilkes。Z.maysmays株包括BS7、HuoBai、Makki、Min13、Pira、Sari、Smena和W22。
本发明的一种优选的稻EG307多肽是由一种稻多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与下列代表的多核苷酸的互补序列杂交:SEQ ID NO:1,SEQ ID NO:91,SEQ ID.NO:2,SEQ IDNO:4,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:17,和/或SEQ ID NO:18。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与含有下列核酸序列的多核苷酸杂交:SEQID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:5,SEQ ID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:17,和/或SEQ ID NO:18。
对EG307基因组核酸序列的检查表明,该基因包含几个区,包括第一个外显子区、第一个内含子区、第二个外显子区、第二个内含子区和第三个外显子区。
多核苷酸SEQ ID NO:4和SEQ ID NO:91代表稻(cv.Nipponbare)的EG307基因的5′和3′端。SEQ ID NO:4和SEQ IDNO:91通过多个核苷酸连接,由于该基因非编码部分的可能的插入/缺失,其准确数量不知,但是认为约为6个。SEQ ID NO:4和SEQ IDNO:91的翻译提示,稻EG307多核苷酸包含一个开放阅读框。该阅读框编码一种约447个氨基酸的稻EG307多肽,其推断的氨基酸序列如此处SEQ ID NO:6所示,假定开放阅读框含有一个从SEQ IDNO:4的大约核苷酸37到大约核苷酸39的起始密码子,和一个从SEQID NO:4的大约核苷酸2278到约核苷酸2280的终止密码子,第一个外显子包括SEQ ID NO:4的核苷酸1-126,第一个内含子包括SEQ IDNO:91的核苷酸9-822,第二个外显子包括SEQ ID NO:91的核苷酸823-1141,第二个内含子包括SEQ ID NO:91的核苷酸1142-1222,第三个外显子包括SEQ ID NO:91的核苷酸1223-2157。从SEQ ID NO:4的核苷酸37到约核苷酸2280的开放阅读框如此处SEQ ID NO:5所示。
类似地,稻(Azucena株)多核苷酸SEQ ID NO:1的翻译提示存在一个从SEQ ID NO:1的大约核苷酸3到大约核苷酸2410的开放阅读框,第一个外显子包括SEQ ID NO:1的核苷酸1-92,第一个内含子包括SEQ ID NO:1的核苷酸93-1075,第二个外显子包括SEQ ID NO:1的核苷酸1076-1394,第二个内含子包括SEQ ID NO:1的核苷酸1395-1475,第三个外显子包括SEQ ID NO:1的核苷酸1476-2441。该开放阅读框在此如SEQ ID NO:2所示,编码如此处SEQ ID NO:3所示的多肽。
类似地,稻(Teqing株)多核苷酸SEQ ID NO:7的翻译提示存在一个从大约核苷酸21到大约核苷酸2421的开放阅读框,第一个外显子包括SEQ ID NO:7的核苷酸1-110,第一个内含子包括SEQ IDNO:7的核苷酸111-1089,第二个外显子包括SEQ ID NO:7的核苷酸1090-1405,第二个内含子包括SEQ ID NO:7的核苷酸1406-1486,第三个外显子包括SEQ ID NO:7的核苷酸1487-2461。该开放阅读框在此如SEQ ID NO:8所示,编码如此处SEQ ID NO:9所示的多肽。
类似地,多核苷酸SEQ ID NO:10和SEQ ID NO:11代表稻(Lemont株)的EG307基因的5′和3′端。SEQ ID NO:10和SEQ IDNO:11通过数量未知的核苷酸连接。在该基因组序列中,基因的非编码部分可能有插入/缺失,因此核苷酸的实际数量未知,但是认为约10个。稻(Lemont株)多核苷酸SEQ ID NO:10和SEQ ID NO:11的翻译提示存在一个从SEQ ID NO:10的大约核苷酸166到SEQ ID NO:11的大约核苷酸1547的开放阅读框,第一个外显子包括SEQ ID NO:10的核苷酸1-255,第一个内含子包括SEQ ID NO:10的核苷酸255-451和SEQ ID NO:11的核苷酸1-212,第二个外显子包括SEQ ID NO:11的核苷酸213-531,第二个内含子包括SEQ ID NO:11的核苷酸532-612,第三个外显子包括SEQ ID NO:11的核苷酸613-1616。该开放阅读框在此如SEQ ID NO:12所示,编码如此处SEQ ID NO:13所示的多肽。
类似地,稻(IR64株)多核苷酸SEQ ID NO:14的翻译提示存在一个从大约核苷酸1到大约核苷酸2400的开放阅读框,第一个外显子包括SEQ ID NO:14的核苷酸1-90,第一个内含子包括SEQ ID NO:14的核苷酸91-1068,第二个外显子包括SEQ ID NO:14的核苷酸1069-1384,第二个内含子包括SEQ ID NO:14的核苷酸1385-1465,第三个外显子包括SEQ ID NO:14的核苷酸1466-2459。该开放阅读框在此如SEQ ID NO:14所示,编码如此处SEQ ID NO:15所示的多肽。
类似地,稻(Kasalath株)多核苷酸SEQ ID NO:17的翻译提示存在一个从大约核苷酸2到大约核苷酸2402的开放阅读框,第一个外显子包括SEQ ID NO:17的核苷酸1-91,第一个内含子包括SEQ IDNO:17的核苷酸92-1070,第二个外显子包括SEQ ID NO:17的核苷酸1071-1386,第二个内含子包括SEQ ID NO:17的核苷酸1387-1467,第三个外显子包括SEQ ID NO:17的核苷酸1468-2432。
该开放阅读框在此如SEQ ID NO:18所示,编码如此处SEQ IDNO:19所示的多肽。在SEQ ID NO:18中,对于Kasalath 1株,位点889处的“N”是“G”,位点971处的“N”是“A”,使得SEQ ID NO:19的氨基酸残基297是缬氨酸,氨基酸残基324是谷氨酰胺。在SEQ IDNO:18中,对于Kasalath 2株,位点889处的“N”是“G”,位点971处的“N”是“T”,使得SEQ ID NO:19中的氨基酸297是缬氨酸,氨基酸残基324是亮氨酸。在SEQ ID NO:18中,对于Kasalath 3株,位点889处的“N”是“C”,位点971处的“N”是“A”,使得SEQ ID NO:19的氨基酸残基297为亮氨酸,氨基酸残基324为谷氨酰胺。在SEQ IDNO:18中,对于Kasalath 4株,位点889的“N”是“C”,位点971的“N”是“T”,使得SEQ ID NO:19中的氨基酸残基297是亮氨酸,氨基酸残基324是亮氨酸。
本发明的一种优选的稻EG307多肽是由一种多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸杂交:SEQID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:5,SEQ ID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:17,和/或SEQ ID NO:18。
本发明优选的O.rufipogon EG307多肽是由一种O.rufipogon多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸的互补序列杂交:SEQ ID NO:20,SEQ ID NO:21,SEQ IDNO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ IDNO:28,SEQ ID NO:29,SEQ ID NO:30,和/或SEQ ID NO:31。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与含有下列核酸序列的多核苷酸杂交:SEQ ID NO:20,SEQ IDNO:21,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,和/或SEQID NO:31。
多核苷酸SEQ ID NO:27和SEQ ID NO:28代表O.rufipogon(5953株)的EG307基因的5′和3′端。SEQ ID NO:27和SEQ ID NO:28通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约23个。SEQ ID NO:27和SEQ ID NO:28的翻译提示,O.rufipogon EG307多核苷酸包含一个开放阅读框。该阅读框编码一种约446个氨基酸的O.rufipogon EG307多肽,其推断的氨基酸序列如此处SEQ ID NO:30所示,假定该开放阅读框含有一个从SEQ ID NO:27的大约核苷酸18到大约核苷酸20的起始密码子,和一个从SEQ ID NO:28的大约核苷酸1330到大约核苷酸1332的终止密码子,第一个外显子包括SEQ ID NO:27的核苷酸1-107,不含第一个内含子,第二个外显子包括SEQ ID NO:28的核苷酸1-316,第二个内含子包括SEQ ID NO:28的核苷酸317-397,第三个外显子包括SEQ ID NO:28的核苷酸398-1332。该开放阅读框从SEQ ID NO:27的核苷酸18到SEQ ID NO:28的约核苷酸1332,如此处SEQ ID NO:29所示。
类似地,O.rufipogon(5948株)多核苷酸SEQ ID NO:20的翻译提示存在一个从核苷酸1的5’侧的大约15个核苷酸到大约核苷酸2385的开放阅读框,第一个外显子未显示,第一个内含子包括SEQ IDNO:20的核苷酸1-1053,第二个外显子包括SEQ ID NO:20的核苷酸1054-1369,第二个内含子包括SEQ ID NO:20的核苷酸1370-1450,第三个外显子包括SEQ ID NO:20的核苷酸1451-2447。该开放阅读框如此处SEQ ID NO:21所示,编码如此处SEQ ID NO:22所示的一种多肽。
类似地,多核苷酸SEQ ID NO:23和SEQ ID NO:24代表O.rufipogon(5949株)的EG307基因的5′和3′端。SEQ ID NO:23和SEQID NO:24通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约13个。SEQ ID NO:23和SEQID NO:24的翻译提示存在一个从SEQ ID NO:23的大约核苷酸57到SEQ ID NO:24的大约核苷酸1562的开放阅读框,第一个外显子包括SEQ ID NO:23的核苷酸1-146,第一个内含子包括SEQ ID NO:24的核苷酸1-230,第二个外显子包括SEQ ID NO:24的核苷酸231-546,第二个内含子包括SEQ ID NO:24的核苷酸547-627,第三个外显子包括SEQ ID NO:24的核苷酸628-1615。该开放阅读框如SEQ ID NO:25所示,编码如此处SEQ ID NO:26所示的一种多肽。
类似地,O.rufipogon(IRCG105491株)多核苷酸SEQ ID NO:90的翻译提示存在一个从大约核苷酸1到大约核苷酸1341的开放阅读框。该开放阅读框如此处SEQ ID NO:31所示,编码如此处SEQ IDNO:32所示的一种多肽。
本发明的一种优选的O.rufipogon EG307多肽是由一种多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸杂交:SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,和/或SEQ ID NO:31。
本发明的一种优选的Zea mays parviglumis EG307多肽是由一种Zea mays parviglumis多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示多核苷酸的互补序列杂交:SEQ ID NO:66,SEQ IDNO:67,SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ IDNO:59,和/或SEQ ID NO:78。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与含有下列核酸序列的多核苷酸杂交:SEQ ID NO:66,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:59,和/或SEQ ID NO:78。
SEQ ID NO:66的翻译提示,Zea mays parviglumis EG307多核苷酸(Benz株)包含一个开放阅读框。该阅读框编码约为448个氨基酸的Zea mays parviglumis EG307多肽,其推断的氨基酸序列如此处SEQID NO:68所示,假定该开放阅读框含有一个从SEQ ID NO:66的大约核苷酸1到大约核苷酸3的起始密码子,和一个从SEQ ID NO:66的大约核苷酸2569到大约核苷酸2571的终止密码子,第一个外显子包括SEQ ID NO:66的核苷酸1-81,第一个内含子包括SEQ ID NO:66的核苷酸82-1204,第二个外显子包括SEQ ID NO:66的核苷酸1205-1517,第二个内含子包括SEQ ID NO:66的核苷酸1518-1618,第三个外显子包括SEQ ID NO:66的核苷酸1619-2644。该开放阅读框从SEQ ID NO:66的核苷酸3到大约核苷酸2571,如此处SEQ IDNO:67所示。
类似地,多核苷酸SEQ ID NO:69和SEQ ID NO:70代表Z.maysparviglumis(BK4株)的EG307基因的5′和3′端。SEQ ID NO:69和SEQID NO:70通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约10个。Z.mays parviglumis(BK4株)多核苷酸SEQ ID NO:69和SEQ ID NO:70的翻译提示存在一个从SEQ ID NO:69的大约核苷酸10到SEQ ID NO:70的大约核苷酸1728的开放阅读框,第一个外显子包括SEQ ID NO:69的核苷酸1-90,第一个内含子包括SEQ ID NO:69的核苷酸91-586和SEQ ID NO:70的核苷酸1-361,第二个外显子包括SEQ ID NO:70的核苷酸362-674,第二个内含子包括SEQ ID NO:70的核苷酸675-775,第三个外显子包括SEQ ID NO:11的核苷酸776-1775。该开放阅读框如SEQ ID NO:71所示,编码如此处SEQ ID NO:72所示的一种多肽。
类似地,多核苷酸SEQ ID NO:73和SEQ ID NO:74代表Z.maysparviglumis(IA19株)的EG307基因的5′和3′端。SEQ ID NO:73和SEQ ID NO:74通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约12个。Z.maysparviglumis(IA19株)多核苷酸SEQ ID NO:73和SEQ ID NO:74的翻译提示存在一个从SEQ ID NO:73的大约核苷酸69到SEQ ID NO:74的大约核苷酸1280的开放阅读框,第一个外显子包括SEQ ID NO:73的核苷酸1-149,第一个内含子包括SEQ ID NO:73的核苷酸150-305,第二个外显子包括SEQ ID NO:74的核苷酸1-226,第二个内含子包括SEQ ID NO:74的核苷酸227-327,第三个外显子包括SEQ ID NO:74的核苷酸328-1309。该开放阅读框如此处SEQ ID NO:75所示,编码如此处SEQ ID NO:76所示的一种多肽。
类似地,多核苷酸SEQ ID NO:77和SEQ ID NO:59代表Z.maysparviglumis(Wilkes株)的EG307基因的5′和3′端。SEQ ID NO:77和SEQ ID NO:59通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约14个。Z.maysparviglumis(Wilkes株)多核苷酸SEQ ID NO:77和SEQ ID NO:59的翻译提示存在一个从SEQ ID NO:77的大约核苷酸36到SEQ IDNO:59的大约核苷酸1598的开放阅读框,第一个外显子包括SEQ IDNO:77的核苷酸1-86,第一个内含子包括SEQ ID NO:59的核苷酸1-231,第二个外显子包括SEQ ID NO:59的核苷酸232-544,第二个内含子包括SEQ ID NO:59的核苷酸545-645,第三个外显子包括SEQID NO:59的核苷酸656-1640。该开放阅读框如此处SEQ ID NO:78所示,编码如此处SEQ ID NO:79所示的一种多肽。
本发明的一种优选的EG307多肽是由一种多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸杂交:SEQ IDNO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:38,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ IDNO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:54,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ IDNO:60,SEQ ID NO:62,SEQ ID NO:63,和/或SEQ ID NO:64。
本发明的一种优选的Z.mays mays EG307多肽是由一种Z.maysmays多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸的互补序列杂交:SEQ ID NO:33,SEQ ID NO:34,SEQID NO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:45,SEQ IDNO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:50,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ IDNO:63,和/或SEQ ID NO:64。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格条件下可与含有下列核酸序列的多核苷酸杂交:SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:63,和/或SEQ ID NO:64。
多核苷酸SEQ ID NO:33和SEQ ID NO:34代表Z.mays mays(BS7株)中EG307基因的5′端和3′端。SEQ ID NO:33和SEQ ID NO:34由多个核苷酸连接在一起,由于基因非编码部分中可能的插入/缺失,其确切数量未知,但是认为约21个。SEQ ID NO:33和SEQ ID NO:34的翻译提示,Z.mays mays EG307多核苷酸含有一个开放阅读框。该阅读框编码约448个氨基酸的Z.mays mays EG307多肽,推断的氨基酸序列如此处SEQ ID NO:36所示,假定该开放阅读框含有一个从SEQ ID NO:33的大约核苷酸3到大约核苷酸5的起始密码子,和一个从SEQ ID NO:34的大约核苷酸1396到大约核苷酸1398的终止密码子,第一个外显子包括SEQ ID NO:33的核苷酸1-83,第一个内含子包括SEQ ID NO:33的核苷酸84-180和SEQ ID NO:34的核苷酸1-31,第二个外显子包括SEQ ID NO:34的核苷酸32-344,第二个内含子包括SEQ ID NO:34的核苷酸345-445,第三个外显子包括SEQ IDNO:34的核苷酸446-1447。该开放阅读框从SEQ ID NO:33的核苷酸3到SEQ ID NO:34的大约核苷酸1398,如此处SEQ ID NO:35所示。
类似地,Z.mays mays(HuoBai株)多核苷酸SEQ ID NO:37的翻译提示存在一个从大约核苷酸28到大约核苷酸2599的开放阅读框,第一个外显子包括SEQ ID NO:37的核苷酸1-108,第一个内含子包括SEQ ID NO:37的核苷酸109-1232,第二个外显子包括SEQ ID NO:37的核苷酸1233-1545,第二个内含子包括SEQ ID NO:37的核苷酸1546-1646,第三个外显子包括SEQ ID NO:37的核苷酸1647-2646。该开放阅读框如此处SEQ ID NO:38所示,编码如此处SEQ ID NO:39所示的一种多肽。
类似地,核苷酸SEQ ID NO:40和SEQ ID NO:41代表Z.maysmays(Makki株)的EG307基因的5′端和3′端。SEQ ID NO:40和SEQID NO:41通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约20个。Z.mays mays(Makki株)多核苷酸SEQ ID NO:40和SEQ ID NO:41的翻译提示存在一个从SEQ ID NO:40的大约核苷酸61到SEQ ID NO:41的大约核苷酸2263的开放阅读框,第一个外显子包括SEQ ID NO:40的核苷酸1-141,第一个内含子包括SEQ ID NO:40的核苷酸142-262和SEQ ID NO:41的核苷酸1-896,第二个外显子包括SEQ ID NO:41的核苷酸897-1209,第二个内含子包括SEQ ID NO:41的核苷酸1210-1310,第三个外显子包括SEQ ID NO:41的核苷酸1311-2311。该开放阅读框如SEQ IDNO:42所示,编码如此处SEQ ID NO:43所示的一种多肽。
类似地,多核苷酸SEQ ID NO:44、SEQ ID NO:45和SEQ IDNO:46代表Z.mays mays(Min13株)的EG307基因从5′端到3′端的三个部分。SEQ ID NO:44、SEQ ID NO:45和SEQ ID NO:46通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为SEQ ID NO:44与SEQ ID NO:45之间为19个,SEQID NO:45与SEQ ID NO:46之间为17个。Z.mays mays(Min13株)多核苷酸SEQ ID NO:44、SEQ ID NO:45和SEQ ID NO:46的翻译提示存在一个从SEQ ID NO:44的大约核苷酸45到SEQ ID NO:46的大约核苷酸1741的开放阅读框,第一个外显子包括SEQ ID NO:44的核苷酸1-125,第一个内含子包括SEQ ID NO:45的核苷酸1-198和SEQID NO:46的核苷酸1-374,第二个外显子包括SEQ ID NO:46的核苷酸375-687,第二个内含子包括SEQ ID NO:46的核苷酸688-788,第三个外显子包括SEQ ID NO:46的核苷酸789-1787。该开放阅读框如此处SEQ ID NO:47所示,编码如此处SEQ ID NO:48所示的一种多肽。
类似地,多核苷酸SEQ ID NO:49和SEQ ID NO:50代表Z.maysmays(Pira株)的EG307基因的5′和3′端。SEQ ID NO:49和SEQ IDNO:50通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知。Z.mays mays(Pira株)多核苷酸SEQ IDNO:49和SEQ ID NO:50的翻译提示存在一个从SEQ ID NO:49的大约核苷酸31到SEQ ID NO:50的大约核苷酸1722的开放阅读框,第一个外显子包括SEQ ID NO:49的核苷酸1-111,第一个内含子包括SEQ ID NO:49的核苷酸112-495和SEQ ID NO:50的核苷酸1-355,第二个外显子包括SEQ ID NO:50的核苷酸356-668,第二个内含子包括SEQ ID NO:50的核苷酸669-769,第三个外显子包括SEQ IDNO:50的核苷酸770-1768。该开放阅读框如此处SEQ ID NO:51所示,编码如此处SEQ ID NO:52所示的一种多肽。
类似地,多核苷酸SEQ ID NO:53和SEQ ID NO:54代表Z.maysmays(Sari株)的EG307基因的5′和3′端。SEQ ID NO:53和SEQ IDNO:54通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约22个。Z.mays mays(Pira株)多核苷酸SEQ ID NO:53和SEQ ID NO:54的翻译提示存在一个从SEQ ID NO:53的大约核苷酸19到SEQ ID NO:54的大约核苷酸1756的开放阅读框,第一个外显子包括SEQ ID NO:53的核苷酸1-99,第一个内含子包括SEQ ID NO:53的核苷酸100-212和SEQ ID NO:54的核苷酸1-389,第二个外显子包括SEQ ID NO:54的核苷酸390-702,第二个内含子包括SEQ ID NO:54的核苷酸703-803,第三个外显子包括SEQ ID NO:54的核苷酸804-1803。该开放阅读框如此处SEQ IDNO:55所示,编码如此处SEQ ID NO:56所示的一种多肽。
类似地,多核苷酸SEQ ID NO:57和SEQ ID NO:58代表Z.maysmays(Smena株)的EG307基因的5′和3′端。SEQ ID NO:57和SEQ IDNO:58通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为是14个。Z.mays mays(Smena株)多核苷酸SEQ ID NO:57和SEQ ID NO:58的翻译提示存在一个从SEQ ID NO:57的大约核苷酸68到SEQ ID NO:58的大约核苷酸2199的开放阅读框,第一个外显子包括SEQ ID NO:57的核苷酸1-148,第一个内含子包括SEQ ID NO:57的核苷酸149-305和SEQ ID NO:58的核苷酸1-834,第二个外显子包括SEQ ID NO:58的核苷酸835-1147,第二个内含子包括SEQ ID NO:58的核苷酸1148-1248,第三个外显子包括SEQ ID NO:58的核苷酸1249-2208。另外,序列SEQ ID NO:59在SEQ ID NO:59的核苷酸738之后的开始处还含有一个缺失。该开放阅读框如此处SEQ ID NO:60所示,编码如此处SEQ ID NO:61所示的一种多肽。
类似地,多核苷酸SEQ ID NO:62和SEQ ID NO:63代表Z.maysmays(W22株)的EG307基因的5′和3′端。SEQ ID NO:62和SEQ IDNO:63通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约22个。Z.mays mays(W22株)多核苷酸SEQ ID NO:62和SEQ ID NO:63的翻译提示存在一个从SEQ ID NO:62的大约核苷酸1到SEQ ID NO:63的大约核苷酸1367的开放阅读框,第一个外显子包括SEQ ID NO:62的核苷酸1-81,第一个内含子包括SEQ ID NO:62的核苷酸82-893,第二个外显子包括SEQ ID NO:63的核苷酸1-313,第二个内含子包括SEQ ID NO:63的核苷酸314-414,第三个外显子包括SEQ ID NO:63的核苷酸415-1411。该开放阅读框如此处SEQ ID NO:64所示,编码如此处SEQ ID NO:65所示的一种多肽。
本发明的一种优选的Z.mays mays EG307多肽是由一种多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸杂交:SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:63,和/或SEQ ID NO:64。
本发明的一种优选的O.rufipogon EG307多肽是由一种多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸杂交:SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,和/或SEQ ID NO:31。
本发明的一种优选的Zea diploperennis EG307多肽是由一种Zeamays parviglumis多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO:82代表的多核苷酸的互补序列杂交。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与含有核酸序列SEQ ID NO:80、SEQ IDNO:81和/或SEQ ID NO:82的多核苷酸杂交。
多核苷酸SEQ ID NO:80和SEQ ID NO:81代表Z.diploperennis的EG307基因的5′和3′端。SEQ ID NO:80和SEQ ID NO:81通过多个核苷酸连接,由于该基因的非编码部分中可能的插入/缺失,其准确数量未知,但是认为约24个。本发明的一种优选的Zea diploperennisEG307多肽是由一种Zea diploperennis多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与SEQ ID NO:80和SEQ ID NO:81代表的多核苷酸的互补序列杂交。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与含有核酸序列SEQ ID NO:80和SEQID NO:81的多核苷酸杂交。
SEQ ID NO:80和SEQ ID NO:81的翻译提示,Zea maysdiploperennis EG307多核苷酸含有一个开放阅读框。该阅读框编码一种约448个氨基酸的Zea diploperennis EG307多肽,其推断的氨基酸序列如此处SEQ ID NO:83所示,假定该开放阅读框含有从SEQ IDNO:80的大约核苷酸21到大约核苷酸23的起始密码子,和从SEQ IDNO:81的大约核苷酸1656到大约核苷酸1658的终止密码子,第一个外显子包括SEQ ID NO:80的核苷酸1-101,第一个内含子包括SEQ IDNO:80的核苷酸102-225和SEQ ID NO:81的核苷酸1-291,第二个外显子包括SEQ ID NO:81的核苷酸292-313,第二个内含子包括SEQ IDNO:81的核苷酸314-705,第三个外显子包括SEQ ID NO:81的核苷酸706-1672。该开放阅读框从SEQ ID NO:80的核苷酸21到SEQ IDNO:81的约核苷酸1658,如此处SEQ ID NO:82所示。
本发明的一种优选的Z.diploperennis EG307多肽是由一种多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO:82代表的多核苷酸杂交。
本发明的一种优选的Zea luxurians EG307多肽是由一种Zealuxurians多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与SEQ ID NO:84和/或SEQ ID NO:85所示多核苷酸的互补序列杂交。这种EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与含有核苷酸序列SEQ ID NO:84和/或SEQ ID NO:85的多核苷酸杂交。
SEQ ID NO:84的翻译提示,Zea luxurians EG307多核苷酸含有一个开放阅读框。该阅读框编码一种约448个氨基酸的Zea luxuriansEG307多肽,其推断的氨基酸序列如此处SEQ ID NO:86所示,假定该开放阅读框含有一个从SEQ ID NO:84的大约核苷酸5到大约核苷酸7的起始密码子,和一个从SEQ ID NO:84的大约核苷酸2365到大约核苷酸2367的终止密码子,第一个外显子包括SEQ ID NO:84的核苷酸1-85,第一个内含子包括SEQ ID NO:84的核苷酸86-998,第二个外显子包括SEQ ID NO:84的核苷酸999-1311,第二个内含子包括SEQ ID NO:84的核苷酸1312-1414,第三个外显子包括SEQ ID NO:84的核苷酸1415-2423。该开放阅读框从SEQ ID NO:84的核苷酸5到约核苷酸2367,如此处SEQ ID NO:85所示。
本发明的一种优选的Z.luxurians EG307多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与SEQ ID NO:84和/或SEQ IDNO:85代表的多核苷酸杂交。
多种稻、O.rufipogon、Z.mays mays、Z.mays parviglumis、Z.diploperennis和Z.luxurians EG307核酸序列和氨基酸序列的比较表明,这些植物种具有相似的EG307基因和多肽。当互相比较时,来自稻和O.rufipogon不同株的EG307的编码区的核苷酸序列具有99.0%的序列同一性,这说明它们是同源的。所有水稻序列,包括祖先的和现代的,都具有相同的终止密码子(TAG),而且(对于我们迄今收集的5′UTR序列),5′UTR序列具有98.4%的序列同一性。稻和O.rufipogon不同株的蛋白质序列具有98.2%的序列同一性,再次证明了它们是同源序列。来自水稻的EG307的蛋白质序列与来自玉米的EG307的蛋白质序列大约94%相同,再次证明了它们的同源性。玉米EG307和玉米草EG307的蛋白质序列具有99.8%的序列同一性。
在稻、O.rufipogon、Z.mays mays、Z.mays parviglumis、Z.diploperennis和Z.luxurians EG307核酸序列和氨基酸序列之间发现这种程度的同一性支持了获得任何植物EG307多肽和多核苷酸的能力,假定多肽和核酸序列在此公开。这些植物EG307多肽和编码它们的多核苷酸代表用于提高植物产量的新型化合物。
本发明优选的植物EG307多肽包括如下多肽,它们包含的氨基酸序列与此处公开的本发明的稻、O.rufipogon、Z.mays mays、Z.maysparviglumis、Z.diploperennis和Z.luxurians EG307多肽的一种或多种氨基酸序列至少约30%相同,优选地至少约50%,更优选地至少约75%,更优选地至少约80%,更优选地至少约85%,更优选地至少约90%,更优选地至少约95%,更优选地至少约98%相同。本发明的更优选的植物EG307多肽包括:由SEQ ID NO:1和/或SEQ ID NO:2的至少一部分编码的多肽,因此,含有至少包含SEQ ID NO:3的一部分的氨基酸序列;由SEQ ID NO:4、SEQ ID NO:81和/或SEQ ID NO:5的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:6的一部分的氨基酸序列;由SEQ ID NO:7和/或SEQ ID NO:8的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:9的一部分的氨基酸序列;由SEQ ID NO:10、SEQ ID NO:11和/或SEQ ID NO:12的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:13的一部分的氨基酸序列;由SEQ ID NO:14和/或SEQ ID NO:15的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:16的一部分的氨基酸序列;由SEQ IDNO:17和/或SEQ ID NO:18的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:19的一部分的氨基酸序列;由SEQ ID NO:20和/或SEQ ID NO:21的至少一部分编码的多肽,因此含有至少包含SEQ IDNO:22的一部分的氨基酸序列;由SEQ ID NO:23、SEQ ID NO:24和/或SEQ ID NO:25的至少一部分编码的多肽,因此含有至少包含SEQID NO:26的一部分的氨基酸序列;由SEQ ID NO:27、SEQ ID NO:28和/或SEQ ID NO:29的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:30的一部分的氨基酸序列;由SEQ ID NO:90和/或SEQID NO:31的至少一部分编码的多肽,因此含有至少包含SEQ IDNO:32的一部分的氨基酸序列;由SEQ ID NO:33、SEQ ID NO:34和/或SEQ ID NO:35的至少一部分编码的多肽,因此含有至少包含SEQID NO:36的一部分的氨基酸序列;由SEQ ID NO:37和/或SEQ IDNO:38的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:39的一部分的氨基酸序列;由SEQ ID NO:40、SEQ ID NO:41和/或SEQID NO:42的至少一部分编码的多肽,因此含有至少包含SEQ IDNO:43的一部分的氨基酸序列;由SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46和/或SEQ ID NO:47的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:48的一部分的氨基酸序列;由SEQ IDNO:49、SEQ ID NO:50和/或SEQ ID NO:51的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:52的一部分的氨基酸序列;由SEQID NO:53、SEQ ID NO:54和/或SEQ ID NO:55的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:56的一部分的氨基酸序列;由SEQ ID NO:57、SEQ ID NO:58和/或SEQ ID NO:60的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:61的一部分的氨基酸序列;由SEQ ID NO:62、SEQ ID NO:63和/或SEQ ID NO:64的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:65的一部分的氨基酸序列;由SEQ ID NO:66和/或SEQ ID NO:67的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:68的一部分的氨基酸序列;由SEQ IDNO:69、SEQ ID NO:70和/或SEQ ID NO:71的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:72的一部分的氨基酸序列;由SEQID NO:73、SEQ ID NO:74和/或SEQ ID NO:75的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:76的一部分的氨基酸序列;由SEQ ID NO:77、SEQ ID NO:59和/或SEQ ID NO:78的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:79的一部分的氨基酸序列;由SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO:82的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:83的一部分的氨基酸序列;以及由SEQ ID NO:84和/或SEQ ID NO:85的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:86的一部分的氨基酸序列。如此处所用的一种多核苷酸或多肽的“至少一部分”是指如上所述具有这些序列的最小大小特征的一部分,或全长分子的任何较大的片段,可达及包括全长分子。例如,一种多核苷酸的一部分可以是12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸等,直到全长多核苷酸。类似地,一种多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,直到全长多肽。将要使用的部分的长度将取决于具体用途。如上所述,用作杂交探针的多核苷酸的一部分可以短至12个核苷酸。用作表位的多肽的一部分可以短至4个氨基酸。行使全长多肽功能的多肽的一部分通常超过4个氨基酸。
本发明特别优选的植物EG307多肽是包含下列序列的多肽:SEQID NO:3,SEQ ID NO:6,SEQ ID NO:9,SEQ ID NO:13,SEQ IDNO:16,SEQ ID NO:19,SEQ ID NO:22,SEQ ID NO:26,SEQ IDNO:30,SEQ ID NO:32,SEQ ID NO:36,SEQ ID NO:39,SEQ IDNO:43,SEQ ID NO:48,SEQ ID NO:52,SEQ ID NO:56,SEQ IDNO:61,SEQ ID NO:65,SEQ ID NO:68.SEQ ID NO:72,SEQ IDNO:76,SEQ ID NO:79,SEQ ID NO:83和/或SEQ ID NO:86(包括但不限于编码的多肽、全长多肽、加工的多肽、融合多肽和多价多肽),以及如下多肽:它们是至少包含上述SEQ ID Nos的部分的多肽的截短同源物。生产这些多肽的方法的实例在此公开,包括在实施例部分内。
B.EG1117多肽
本发明的一个实施方案是一种分离的植物EG1117多肽。在一个实施方案中,如此处所用的EG307多肽是与约552个氨基酸的O.rufigogon多肽有关(即具有结构相似性)的一种多肽,其含有图7所示的序列(SEQ ID NO:95)。实施例中详细描述了最初对这种多肽的鉴定。一种优选的EG1117多肽由一种多核苷酸编码,该多核苷酸在严格杂交条件下可与下列至少一种基因杂交:(a)编码稻EG1117多肽的基因(即稻基因);(b)编码O.rufipogon EG1117多肽的基因(即O.rufipogon基因);(c)编码Zea mays mays EG1117基因的基因;(d)编码Zea mays parviglumis EG1117多肽的基因(即Z.mays parviglumis基因)。
如此处所用的稻EG1117基因包括与天然稻EG307基因有关的所有核酸序列,如控制该基因编码的稻EG1117多肽产生的调节区(例如但不限于:转录、翻译或翻译后控制区),及其编码区。在一个实施方案中,稻EG1117基因包含核酸序列SEQ ID NO:4。核酸序列SEQID NO:4代表推断的cDNA(互补DNA)多核苷酸的序列,其产生在实施例中公开。应当指出,由于核酸测序技术不会完全没有错误,因此SEQ ID NO:4(以及此处所示的其它序列)最多代表编码本发明的稻EG307多肽的多核苷酸的表观核酸序列。
在另一个实施方案中,稻EG1117基因可以是一种等位基因变体,包含与SEQ ID NO:92和/或SEQ ID NO:93相似但不相同的序列。
可以根据在功能测定中行使天然EG1117功能的能力,鉴定本发明的一种EG1117多肽。“天然EG1117多肽”是指稻、O.rufipogon、Z.mays mays和/或Z.mays parviglumis的全长EG1117多肽。短语“在功能测定中能够行使天然EG1117的功能”是指该多肽在功能测定中具有天然多肽的至少约10%的活性。在其它优选实施方案中,EG1117多肽在功能测定中具有天然多肽的至少约20%的活性。在其它优选实施方案中,EG1117多肽在功能测定中具有天然多肽的至少约30%的活性。在其它优选实施方案中,EG1117多肽在功能测定中具有天然多肽的至少约40%的活性。在其它优选实施方案中,EG1117多肽在功能测定中具有天然多肽的至少约50%的活性。在其它优选实施方案中,该多肽在功能测定中具有天然多肽的至少约60%的活性。在更优选的实施方案中,该多肽在功能测定中具有天然多肽的至少约70%的活性。在更优选的实施方案中,该多肽在功能测定中具有天然多肽的至少约80%的活性。在更优选的实施方案中,该多肽在功能测定中具有天然多肽的至少约90%的活性。功能测定的例子包括抗体结合测定或产量提高测定,如本申请书其它部分所详述。
如此处所用的分离的植物EG1117多肽可以是一种全长多肽或这种多肽的任何同源物。在一个实施方案中,当使用本领域公知的技术对动物施用该同源物作为一种免疫原时,该动物将产生针对天然EG1117多肽的至少一个表位的体液和/或细胞免疫应答。EG1117同源物也能够根据它们在功能测定中行使EG1117功能的能力选择。
植物EG1117多肽同源物可能是自然等位基因变异或自然突变的结果。本发明的EG1117多肽同源物也能够用本领域公知的技术产生,包括但不限于,例如使用经典的或重组DNA技术直接修饰多肽或修饰编码该多肽的基因,以实现随机或靶向诱变。
根据本发明,模拟表位是指能够模拟分离的本发明的植物EG307多肽在功能测定中行使本发明的EG307多肽功能的能力的任何化合物。模拟表位的例子包括但不限于:抗独特型抗体或其片段,其包含至少一个结合位点,该位点模拟分离的本发明的多肽的一个或多个表位;分离的多肽的非肽免疫原性部分(例如碳水化合物结构);合成或自然有机分子,包括核酸,其结构类似于分离的本发明的多肽的至少一个表位。能够利用计算机产生的本发明的多肽的结构设计这些模拟表位。模拟表位也能够如下获得:产生分子的随机样品,如寡核苷酸、肽或其它有机分子,使用相应的结合配偶体利用亲和层析技术筛选这些样品。
本发明的EG307多肽同源物的最小大小足以由一种多核苷酸编码,该多核苷酸能够与编码相应天然多肽的多核苷酸的互补序列形成稳定的杂合体。最小大小特征在此公开。
任何植物EG1117多肽都是本发明的合适的多肽。分离EG1117多肽(包括天然多肽的分离或通过重组或合成技术生产多肽)的合适的植物包括标题为“EG307多肽”的部分所述。
本发明的一种优选的植物EG1117多肽是一种化合物,当在植物中表达或调节时,能够提高该植物的产量。
本发明的一个实施方案是一种融合多肽,其包含与融合片段连接的含有EG1117多肽的结构域。
本发明优选的植物EG1117多肽是水稻EG1117多肽和玉米EG1117多肽。更优选的EG1117多肽是稻、O.rufipogon、Z.mays mays和Zea mays parviglumis EG1117多肽。稻株包括Nipponbare、Azucena、Kasalath 1、2、3和4、Teqing、Lemont和IR64。Z.maysparviglumis株包括Benz、BK4、IA19和Wilkes。Z.mays mays株包括BS7、HuoBai、Makki、Min13、Pira、Sari、Smena和W22。
本发明的一种优选的O.rufipogon EG1117多肽是由一种O.rufipogon多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸的互补序列杂交:SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:97和/或SEQ ID NO:98。
本发明的一种优选的稻EG1117多肽是由一种稻多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸的互补序列杂交:SEQ ID NO:100,SEQ ID NO:101,SEQ ID NO:102,SEQID NO:103,SEQ ID NO:104,SEQ ID NO:104,SEQ ID NO:106,SEQID NO:107,SEQ ID NO:109,SEQ ID NO:110,SEQ ID NO:112,SEQID NO:113,SEQ ID NO:114,SEQ ID NO:116,SEQ ID NO:117。
本发明的一种优选的Z.mays mays EG1117多肽是由一种Z.maysmays多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸的互补序列杂交:SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:124,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:128,SEQ ID NO:129,SEQ ID NO:130,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147,SEQ ID NO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:155。
本发明的一种优选的Z.mays parviglumis EG1117多肽是由一种Z.mays parviglumis多核苷酸编码的多肽,该多核苷酸在严格杂交条件下可与如下所示的多核苷酸的互补序列杂交:SEQ ID NO:157,SEQID NO:158,SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162,SEQID NO:163,SEQ ID NO:165,SEQ ID NO:166,SEQ ID NO:167和/或SEQ ID NO:168。
对水稻EG1117基因组核酸序列的研究表明,该基因含有几个区,包括第一个外显子区、第一个内含子区、第二个外显子区、第二个内含子区、第三个外显子区、第三个内含子区和第四个外显子区。这些区在每种EG1117水稻和水稻祖先的基因组核酸序列中的位置总结于下表中:
  生物  SEQ ID.NO. 外显子 内含子 外显子 内含子 外显子 内含子 外显子
  O.rufipogon株5948(5′-端)    92 1-64 65-349 350-567 568-702 703-1259 - -
  O.rufipogon株5948(3′-端)    93 1-868 - - - - - -
  O.rufipogon株5949(5′-端)    96 1-35 36-320 321-538 539-673 674-1230 - -
  O.rufipogon株5949(3′-端)    97 - 1-357 358-1225 - - - -
  稻株Azucena    100 1-64 65-349 350-567 568-702 703-1259 1260-1731 1732-2599
  稻株IR64    103 1-64 65-349 350-567 568-702 703-1259 1260-1733 1734-2601
  稻株Kasalath    106 1-64 65-349 350-567 568-702 703-1259 1260-1733 1734-2601
  稻株Lemont    109 1-64 65-349 350-567 568-702 703-1259 1260-1731 1732-2599
  稻株Nipponbare(5′-端)    112 1-64 65-349 350-567 568-702 703-1259 - -
  稻株Nipponbare(3′-端)    113 1-864 - - - - - -
  稻株Teqing    116 1-64 65-349 350-567 568-702 703-1259 1260-1733 1734-2601
这些基因组序列的翻译提示,O.rufipogon和稻EG1117多核苷酸含有开放阅读框。利用推断的稻Nipponbare株的蛋白质序列进行BLAST搜索。对拟南芥PTR2-B(组氨酸转运蛋白,NP_178313)的极强的蛋白质BLAST命中提示水稻序列只丢失了编码序列(CDS)的大约30个密码子(图8)。
最后,推断的编码序列和蛋白质序列显示如下:
生物   部分CDS的SEQ ID NO:   部分蛋白质的SEQ ID NO:
  O.rufipogon株5948     94     95
  O.rufipogon株5949     98     99
  稻株  Azucena     101     102
  稻株  IR64     104     105
  稻株  Kasalath     107     108
  稻株  Lemont     110     111
  稻株  Nipponbare     114     115
  稻株  Teqing     117     118
已经测定了玉米和玉米草的EG1117的部分序列。该信息总结于下表中:
         生物    SEQID NO:    外显子   内含子    外显子      CDS
 Zea mays mays株BS7     119   1-531   -     -     1-531
 Zea mays mays株Enano     122   1-365   366-536     -     1-365
 Zea mays mays株Enano     123   -   1-393     394-550     394-550
 Zea mays mays株Enano     124   1-533   -     -     1-533
 Zea mays mays株Huobai     127   1-375   376-525     -     1-375
 Zea mays mays株Huobai     128   -   1-143     144-334     144-334
 Zea mays mays株Huobai     129   1-529   -     -     1-529
 Zea mays mays株Makki     132   1-513   -     -     1-513
 Zea mays mays株Min13     135   1-374   375-545     -     1-374
 Zea mays mays株Min13     136   -   1-390     391-570     391-570
 Zea mays mays株Min13     137   1-525   -     -     1-525
 Zea mays mays株Pira     140   1-371   372-526     -     1-371
 Zea mays mays株Pira     141   1-525   -     -     1-525
 Zea mays mays株Sari     144   1-364   365-499     -     1-364
 Zea mays mays株Sari     145   -   1-422     423-607     423-607
 Zea mays mays株Sari     146   1-520   -     -     1-520
 Zea mays mays株Smena     149   1-371   372-543     -     1-371
 Zea mays mays株Smena     150   -   1-262     263-443     263-443
 Zea mays mays株Smena     151   1-523   -     -     1-523
 Zea mays mays株W22     154   1-488   -     -     1-488
 Zea mays parviglumis株Benz     157   1-516   -     -     1-516
 Zea mays parviglumis株BK4     160   1-372   373-385     -     1-372
 Zea mays parviglumis株BK4     161   -   1-433     434-613     434-613
 Zea mays parviglumis株BK4     162   1-462   -     -     1-462
 Zea mays parviglumis株Wilkes     165   1-355   356-556     -     1-355
 Zea mays parviglumis株Wilkes     166   -   1-395     396-552     396-552
 Zea mays parviglumis株Wilkes     167   1-511   -     -     1-511
这些基因组序列的翻译提示,Z.mays mays和Z.mays parviglumisEG1117多核苷酸含有开放阅读框。开放阅读框的信息总结于下表中:
生物 部分CDS的      部分蛋白质的SEQ ID NO:    SEQ ID NO:
    Zea mays mays株BS7     120            121
    Zea mays mays株Enano     125            126
    Zea mays mays株Huobai     130            131
    Zea mays mays株Makki     133            134
    Zea mays mays株Min13     138            139
    Zea mays mays株Pira     142            143
    Zea mays mays株Sari     147            148
    Zea mays mays株Smena     152            153
    Zea mays mays株W22     155            156
    Zea mays parviglumis株Benz     158            159
    Zea mays parviglumis株BK4     163            164
    Zea mays parviglumis株Wilkes     168            169
本发明优选的植物EG1117多肽包括如下多肽,其含有的氨基酸序列与此处公开的本发明的稻、O.rufipogon、Z.mays mays和Z.maysparviglumis EG1117多肽的一种或多种氨基酸序列至少约30%,优选地至少约50%,更优选地至少约75%,更优选地至少约80%,更优选地至少约85%,更优选地至少约90%,更优选地至少约95%,更优选地至少约98%相同。本发明的更优选的植物EG1117多肽包括:由SEQ ID NO:92、SEQ ID NO:93和/或SEQ ID NO:94的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:95的一部分的氨基酸序列;由SEQ ID NO:96、SEQ ID NO:97和/或SEQ ID NO:98的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:99的一部分的氨基酸序列;由SEQ ID NO:100和/或SEQ ID NO:101的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:102的一部分的氨基酸序列;由SEQ ID NO:103和/或SEQ ID NO:104的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:105的一部分的氨基酸序列;由SEQID NO:106和/或SEQ ID NO:107的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:108的一部分的氨基酸序列;由SEQ IDNO:109和/或SEQ ID NO:110的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:111的一部分的氨基酸序列;由SEQ ID NO:112、SEQ ID NO:113和/或SEQ ID NO:114的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:115的一部分的氨基酸序列;由SEQ IDNO:116和/或SEQ ID NO:117的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:118的一部分的氨基酸序列;由SEQ ID NO:119和/或SEQ ID NO:120的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:121的一部分的氨基酸序列;由SEQ ID NO:122、SEQ IDNO:123、SEQ ID NO:124和/或SEQ ID NO:125的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:126的一部分的氨基酸序列;由SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129和/或SEQ IDNO:130的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:131的一部分的氨基酸序列;由SEQ ID NO:132和/或SEQ ID NO:133的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:134的一部分的氨基酸序列;由SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137和/或SEQ ID NO:138的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:139的一部分的氨基酸序列;由SEQ ID NO:140、SEQ IDNO:141和/或SEQ ID NO:142的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:143的一部分的氨基酸序列;由SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146和/或SEQ ID NO:147的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:148的一部分的氨基酸序列;由SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151和/或SEQ ID NO:152的至少一部分编码的多肽,因此含有至少包含SEQ IDNO:153的一部分的氨基酸序列;由SEQ ID NO:154和/或SEQ IDNO:155的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:156的一部分的氨基酸序列;由SEQ ID NO:157和/或SEQ ID NO:158的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:159的一部分的氨基酸序列;由SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162和/或SEQ ID NO:163的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:164的一部分的氨基酸序列;以及由SEQ ID NO:165、SEQID NO:166、SEQ ID NO:167和/或SEQ ID NO:168的至少一部分编码的多肽,因此含有至少包含SEQ ID NO:169的一部分的氨基酸序列。如此处所用的一种多核苷酸或多肽的“至少一部分”是指如上所述具有这些序列的最小大小特征的一部分,或全长分子的任何较大的片段,可达及包括全长分子。例如,一种多核苷酸的一部分可以是12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸等,直到全长多核苷酸。类似地,一种多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,直到全长多肽。将要使用的部分的长度将取决于具体用途。如上所述,用作杂交探针的多核苷酸的一部分可以短至12个核苷酸。用作表位的多肽的一部分可以短至4个氨基酸。行使全长多肽功能的多肽的一部分通常超过4个氨基酸。
本发明特别优选的植物EG1117多肽是包含下列序列的多肽:SEQID NO:95,SEQ ID NO:99,SEQ ID NO:102,SEQ ID NO:105,SEQID NO:108,SEQ ID NO:111,SEQ ID NO:115,SEQ ID NO:118,SEQID NO:121,SEQ ID NO:126,SEQ ID NO:131,SEQ ID NO:134,SEQID NO:139,SEQ ID NO:143,SEQ ID NO:148,SEQ ID NO:153,SEQID NO:156,SEQ ID NO:159,SEQ ID NO:164,SEQ ID NO:169,和/或SEQ ID NO:170(包括但不限于编码的多肽、全长多肽、加工的多肽、融合多肽和多价多肽),以及如下多肽,它们是至少包含上述SEQID Nos的部分的多肽的截短同源物。生产这些多肽的方法的实例在此公开,包括于实施例部分中。
C.EG307多核苷酸
本发明的一个实施方案是一种分离的植物多核苷酸,在严格杂交条件下,该多核苷酸可与下列至少一种基因杂交:稻EG307基因,O.rufipogon EG307基因,Z.mays mays EG307基因,Z.maysparviglumis EG307基因,Z.diploperennis EG307基因,和Z.luxurians基因。这些基因的鉴定的特征在此前描述。本发明的一种多核苷酸可能包含分离的天然植物EG307基因或其同源物,后者在下文更详细地描述。本发明的一种多核苷酸可能包含一个或多个调节区、全长或部分编码区或其组合。本发明的多核苷酸的最小大小是在严格杂交条件下能够与上述基因之一形成稳定杂合体的最小大小。合适的和优选的植物在上文中公开。
根据本发明,一种分离的多核苷酸是从其天然环境中分离的多核苷酸(即已经经历人工操作)。因此,“分离的”不反映多核苷酸纯化的程度。分离的多核苷酸可能包括DNA、RNA或DNA或RNA的衍生物。
本发明的一种分离的植物EG307多核苷酸能够从其天然来源中获得,作为整个(即完整的)基因或能够与该基因形成稳定杂合体的一部分。一种分离的植物EG307多核苷酸也能够用重组DNA技术(例如聚合酶链反应(PCR)扩增,克隆)或化学合成产生。分离的植物EG307多核苷酸包括天然多核苷酸及其同源物,包括但不限于天然等位基因变体和修饰的多核苷酸,其中核苷酸已经以一定方式插入、缺失、置换和/或反转,使得这种修饰基本不会干扰该多核苷酸编码本发明的EG307多肽或在严格条件下与天然基因分离物形成稳定杂合体的能力。
一种植物EG307多核苷酸同源物能够用本领域技术人员公知的大量方法生产(参见,例如,Sambrook等人,同上)。例如,多核苷酸能够用多种技术修饰,包括但不限于经典诱变技术和重组DNA技术,如多核苷酸的定点诱变、化学处理,以诱导突变,核酸片段的限制酶切,核酸片段的连接,聚合酶链反应(PCR)扩增,和/或核酸序列的选定区域的诱变,寡核苷酸混合物的合成和混合物基团的连接,以“建立”多核苷酸的混合物及其组合。根据核酸编码的多肽的功能(例如引发针对EG307多肽的至少一个表位的免疫应答的能力,提高含有EG307基因的转基因植物的产量的能力)筛选,和/或通过与稻EG307基因、O.rufipogon EG307基因、Z.mays mays EG307基因、Z.maysparviglumis EG307基因、Z.diploperennis EG307基因和/或Z.luxurians EG307基因的杂交,能够从修饰的核酸的混合物中选择多核苷酸同源物。
本发明的一种分离的多核苷酸可能包含编码至少一种本发明的植物EG307多肽的核酸序列,这些多肽的例子在此公开。尽管短语“多核苷酸”主要是指物理多核苷酸,而短语“核酸序列”主要是指多核苷酸上的核苷酸序列,但是这两个短语可以互换使用,特别是在用于能够编码EG307多肽的多核苷酸或核酸序列时。如此前公开的,本发明的植物EG307多肽包括但不限于含有全长植物EG307编码区的多肽,含有部分植物EG307编码区的多肽,融合多肽,多价保护性多肽,及其组合。
至少某些本发明的多核苷酸编码可与来自一种动物的免疫血清选择性结合的多肽,该动物事先用分离该多核苷酸的EG307多肽免疫。
本发明的一种优选的多核苷酸当在适当的植物中表达时,能够提高植物的产量。如下文更详细地公开的,这种多核苷酸可能是或者编码一种反义RNA、能够形成三股螺旋的分子、核酶或其它基于核酸的化合物。
本发明的一个实施方案是一种植物EG307多核苷酸,它在严格杂交条件下可与本发明的一种EG307多核苷酸杂交,或与这种EG307多核苷酸的同源物杂交,或与这种多核苷酸的互补序列杂交。本发明的任何核酸序列的多核苷酸互补序列是指与显示其序列的链互补(即能够与其形成完全的双螺旋)的多核苷酸的核酸序列。应当指出,本发明的双链核酸分子,其一条链的核酸序列已经测定,用SEQ ID NO表示,也包含序列与该SEQ ID NO互补的互补链。因此,本发明的多核苷酸可以是双链或单链,包括在严格杂交条件下与此处命名的SEQ ID NO和/或与该SEQ ID NO的互补序列形成稳定杂合体的多核苷酸,它们可能在此命名或者没有命名。本领域技术人员公知推断互补序列的方法。优选的是一种EG307多核苷酸,其包含与编码EG307多肽至少一部分的核酸序列的相应区至少约65%、优选地至少约70%、更优选地至少约75%、更优选地至少约80%、更优选地至少约85%、更优选地至少约90%、更优选地至少约95%同源的核酸序列。特别优选的是一种EG307多核苷酸,它能够编码植物中自然存在的一种EG307多肽的至少一部分。
本发明特别优选的EG307多核苷酸在严格条件下可与下列至少一种多核苷酸杂交:SEQ ID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:10,SEQID NO:11,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ IDNO:17,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:21,SEQ IDNO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ IDNO:28,SEQ ID NO:29,SEQ ID NO:90,SEQ ID NO:31,SEQ IDNO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:38,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ IDNO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:54,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ IDNO:60,SEQ ID NO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ IDNO:66,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:71,SEQ ID NO:73,SEQ ID NO:74,SEQ ID NO:75,SEQ IDNO:77,SEQ ID NO:59,SEQ ID NO:78,SEQ ID NO:80,SEQ IDNO:81,SEQ ID NO:82,SEQ ID NO:84,和/或SEQ ID NO:85,或这种多核苷酸的同源物或互补序列。
本发明的一种优选的多核苷酸包含下列核酸序列的至少一部分:SEQ ID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ ID NO:4,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:23,SEQ IDNO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:28,SEQ IDNO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ IDNO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ IDNO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ IDNO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ IDNO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:66,SEQ IDNO:67,SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ IDNO:59,和/或SEQ ID NO:78,它能够与下列基因杂交(即在严格杂交条件下杂交):本发明的稻EG307基因,O.rufipogon EG307基因,Z.mays mays EG307基因,Z.mays parviglumis EG307基因,Z.diploperennis EG307基因和/或Z.luxurians EG307基因,以及是这些多核苷酸中任一种的等位基因变体的多核苷酸。这些优选的多核苷酸除了SEQ ID Nos中所包含的以外可能还包含核苷酸,例如但不限于:全长基因,全长编码区,编码一种融合多肽的多核苷酸,和/或编码一种多价保护性化合物的多核苷酸。
本发明也包括:编码至少包含SEQ ID NO:3一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:6一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:9一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:13一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:16一部分的一种多肽的多核苷酸,编码至少包含SEQID NO:19一部分的一种多肽的多核苷酸,编码至少包含SEQ IDNO:22一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:26一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:30一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:36一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:39一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:43一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:48一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:52一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:56一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:61一部分的一种多肽的多核苷酸,编码至少包含SEQ IDNO:65一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:68一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:72一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:76一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:79一部分的一种多肽的多核苷酸,编码至少包含SEQ ID NO:83一部分的一种多肽的多核苷酸,和/或编码至少包含SEQ ID NO:86一部分的一种多肽的多核苷酸,包括已经修饰从而适应表达这些多核苷酸的细胞的密码子使用特性的多核苷酸。
了解本发明的某些植物EG307多核苷酸的核酸序列使得本领域技术人员能够,例如:(a)制备这些多核苷酸的拷贝,(b)获得包含这些多核苷酸的至少一部分的多核苷酸(例如包含全长基因、全长编码区、调节控制序列、截短的编码区的多核苷酸),和(c)获得其它植物的EG307多核苷酸,特别是如实施例部分详述,了解本发明的稻EG307多核苷酸使得能够分离本发明的O.rufipogon、Zea mays mays、Zeamays parviglumis、Z.diploperennis和Z.luxurians EG307多核苷酸。这些多核苷酸能够用多种方法获得,包括:用本发明的抗体筛查适当的表达文库;使用本发明的寡核苷酸探针筛查适当文库或DNA的传统克隆技术;和使用本发明的寡核苷酸引物PCR扩增适当的文库或DNA。将要筛查或扩增多核苷酸的优选文库包括如下文库:由分离的植物组织制备的基因组DNA文库、BAC文库、YAC文库、cDNA文库,这些组织包括但不限于:茎、繁殖结构/组织、叶、根和分蘖;以及由来自上述任何或所有组织的合并cDNA构建的文库。对于水稻,可从Clemson大学获得的BAC文库是优选的。类似地,将要筛查或扩增多核苷酸的优选DNA来源包括植物基因组DNA。克隆及扩增基因的技术例如在Sambrook等人,同上,和Galun & Breiman,《转基因植物)》,Imperial College Press,1997中公开。
本发明也包括是如下寡核苷酸的多核苷酸,该寡核苷酸在严格杂交条件下能够与其它、优选地较长的本发明的多核苷酸的互补区杂交,如包含植物EG307基因的多核苷酸或其它植物EG307多核苷酸。本发明的寡核苷酸可以是RNA、DNA或其衍生物。这些寡核苷酸的最小大小是在指定寡核苷酸与本发明的另一种多核苷酸的互补序列之间形成稳定杂合体所需的大小。最小大小的特征在此公开。寡核苷酸的大小也必须足以使用根据本发明的寡核苷酸。本发明的寡核苷酸能够用于多种用途,包括但不限于:用作探针鉴定其它多核苷酸,用作引物扩增或延伸多核苷酸,用作靶标进行表达分析,用作候选物进行定向诱变和/或回收,或者在农业用途中用来改变EG307多肽的产量或活性。这些农业用途包括在例如基于反义、三股螺旋形成、核酶和/或RNA药物的技术中使用这些寡核苷酸。因此本发明包括这些寡核苷酸和方法,以利用一种或多种这样的技术提高植物的经济生产力。
D.EG1117多核苷酸
本发明的一个实施方案是一种分离的植物多核苷酸,它在严格杂交条件下可与下列至少一种基因杂交:稻EG1117基因,O.rufipogonEG1117基因,Z.mays mays EG1117基因,和Z.mays parviglumisEG1117基因。这些基因的鉴定的特征在此前描述。本发明的一种多核苷酸可能包含一种分离的天然植物EG1117基因或其同源物。本发明的一种多核苷酸可能包含一个或多个调节区、全长或部分编码区或其组合。本发明的多核苷酸的最小大小是在严格杂交条件下能够与上述基因之一形成稳定杂合体的最小大小。合适的和优选的植物在上文中公开。分离的EG1117基因及其同源物的特征在上文标题为“EG307多核苷酸”的部分中描述。
本发明的一个实施方案是一种植物EG1117多核苷酸,它在严格杂交条件下可与本发明的EG1117多核苷酸杂交,或与这种EG1117多核苷酸的同源物杂交,或与这种多核苷酸的互补序列杂交。优选的是一种EG1117多核苷酸,其包含的核酸序列与编码一种EG1117多肽至少一部分的核酸序列的相应区至少约65%、优选地至少约70%、更优选地至少约75%、更优选地至少约80%、更优选地至少约85%、更优选地至少约90%、更优选地至少约95%同源。特别优选的是一种EG1117多核苷酸,它能够编码植物中天然存在的一种EG1117多肽的至少一部分。
本发明特别优选的EG1117多核苷酸在严格杂交条件下可与下列至少一种多核苷酸杂交,或与这些多核苷酸的同源物或互补序列杂交。
本发明的一种优选的多核苷酸包含核酸序列SEQ ID NO:92的至少一部分,它能够杂交(即在严格杂交条件下杂交)本发明的稻EG1117基因,O.rufipogon EG1117基因,Z.mays mays EG1117基因,和/或Z.mays parviglumis EG1117基因,以及是这些多核苷酸的等位基因变体的多核苷酸。这些优选的多核苷酸除了SEQ ID Nos中所包含的之外还可能包含如下核苷酸,例如但不限于全长基因、全长编码区、编码一种融合多肽的多核苷酸和/或编码一种多价保护性化合物的多核苷酸。
本发明优选的多核苷酸包含下列核酸序列的至少一部分:SEQ IDNO:92,SEQ ID NO:93,SEQ ID NO:94,SEQ ID NO:96,SEQ IDNO:97,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:101,SEQ IDNO:102,SEQ ID NO:103,SEQ ID NO:104,SEQ ID NO:104,SEQ IDNO:106,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:110,SEQ IDNO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:116,SEQ IDNO:117,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ IDNO:122,SEQ ID NO:123,SEQ ID NO:124,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:128,SEQ ID NO:129,SEQ ID NO:130,SEQ IDNO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:136,SEQ IDNO:137,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:141,SEQ IDNO:142,SEQ ID NO:144,SEQ ID NO:145,SEQ ID NO:146,SEQ IDNO:147,SEQ ID NO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ IDNO:152,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:157,SEQ IDNO:158,SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162,SEQ IDNO:163,SEQ ID NO:165,SEQ ID NO:166,SEQ ID NO:167,和/或SEQ ID NO:168,它们能够杂交(即在严格杂交条件下杂交)本发明的稻EG1117基因、O.rufipogon EG1117基因、Z.mays mays EG1117基因和/或Z.mays parviglumis EG1117基因,以及是任何一种这类多核苷酸的等位基因变体的多核苷酸。这些优选的多核苷酸除了SEQ IDNos中所包含的之外还可能包含如下核苷酸,例如但不限于全长基因、全长编码区、编码一种融合多肽的多核苷酸和/或编码一种多价保护性化合物的多核苷酸。
本发明也包括:编码包含SEQ ID NO:95至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:99至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:102至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:105至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:108至少一部分的一种多肽的多核苷酸,编码包含SEQID NO:111至少一部分的一种多肽的多核苷酸,编码包含SEQ IDNO:115至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:118至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:121至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:126至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:131至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:134至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:139至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:143至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:148至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:153至少一部分的一种多肽的多核苷酸,编码包含SEQ IDNO:156至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:159至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:164至少一部分的一种多肽的多核苷酸,编码包含SEQ ID NO:169至少一部分的一种多肽的多核苷酸,包括已经修饰从而适应表达这些多核苷酸的细胞的密码子使用特性的多核苷酸。
了解本发明的某些植物EG1117多核苷酸的核酸序列使得本领域技术人员能够,例如:(a)制备这些多核苷酸的拷贝,(b)获得包含这些多核苷酸的至少一部分的多核苷酸(例如包含全长基因、全长编码区、调节控制序列、截短的编码区的多核苷酸),和(c)获得其它植物的EG1117多核苷酸,特别是如实施例部分详述,了解本发明的稻EG1117多核苷酸使得能够分离本发明的稻、Zea mays mays和Zeamays parviglumis EG1117多核苷酸。这些多核苷酸能够用多种方法获得,包括:用本发明的抗体筛查适当的表达文库;使用本发明的寡核苷酸探针筛查适当文库或DNA的传统克隆技术;和使用本发明的寡核苷酸引物PCR扩增适当的文库或DNA。优选的文库在上文标题为“EG307多核苷酸”的部分中描述。
本发明也包括是如下寡核苷酸的多核苷酸,该寡核苷酸在严格杂交条件下能够与其它、优选地较长的本发明的多核苷酸的互补区杂交,如包含植物EG1117基因的多核苷酸或其它植物EG1117多核苷酸。本发明的寡核苷酸可以是RNA、DNA或其衍生物。这些寡核苷酸的最小大小是在指定寡核苷酸与本发明的另一种多核苷酸的互补序列之间形成稳定杂合体所需的大小。最小大小的特征在此公开。寡核苷酸的大小也必须足以使用根据本发明的寡核苷酸。这些用途在上文标题为“EG307多核苷酸”的部分中描述。
E.重组分子
本发明也包括一种重组载体,其包含至少一种本发明的植物EG307或EG1117多核苷酸,该多核苷酸插入能够将该多核苷酸输送到宿主细胞的任何一种载体中。这种载体含有异源核酸序列,即不与本发明的多核苷酸自然相邻、来源于产生该多核苷酸的种之外的其它种的核酸序列。如此处所用的,衍生的多核苷酸在序列上与多核苷酸或多核苷酸的部分相同或相似,但是可能含有修饰,如修饰的碱基、骨架修饰、核苷酸改变等。载体可以是RNA或DNA,是原核或真核的,一般是病毒或质粒。重组载体能够用于本发明的植物EG307或EG1117多核苷酸的克隆、测序和/或其它操作。一种类型的重组载体,在此被称为重组分子,并在下文更详细地描述,能够在本发明的多核苷酸的表达中使用。优选的重组载体能够在转化的细胞中复制。
本发明的重组载体中包含的合适和优选的多核苷酸如此处关于合适的和优选的植物EG307或EG1117多核苷酸本身所公开的。在本发明的重组载体、特别是重组分子中包含的特别优选的多核苷酸包括:SEQ ID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ ID NO:4,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:23,SEQ IDNO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:28,SEQ IDNO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ IDNO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ IDNO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ IDNO:55,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ IDNO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:66,SEQ IDNO:67,SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ IDNO:59,和/或SEQ ID NO:78。本发明的重组载体、特别是重组分子中包含的备选的优选多核苷酸包括:SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:97,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:101,SEQ ID NO:102,SEQ ID NO:103,SEQ ID NO:104,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:110,SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:124,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:128,SEQ ID NO:129,SEQ ID NO:130,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147,SEQ ID NO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162,SEQ ID NO:163,SEQ ID NO:165,SEQ ID NO:166,SEQ ID NO:167,和/或SEQ ID NO:168。
分离的本发明的植物EG307或EG1117多肽能够用多种方法产生,包括天然多肽的生产和回收,重组多肽的生产和回收,多肽的化学合成。在一个实施方案中,分离的本发明的多肽如下产生:在有效产生该多肽的条件下培养能够表达该多肽的细胞,并回收该多肽。将要培养的一种优选的细胞是能够表达该多肽的重组细胞,用本发明的一种或多种多核苷酸转化宿主细胞产生的重组细胞。用一种多核苷酸转化细胞能够通过将多核苷酸插入细胞内的任何方法实现。转化技术包括但不限于:转染、电穿孔、显微注射、脂转染、吸附和原生质体融合。重组细胞可以是单细胞的,或者可以生长为组织、器官或多细胞生物。转化的本发明的多核苷酸可能保留在染色体外,或者可能整合到转化(即重组)细胞染色体内的一个或多个位点,这样它们被表达的能力得以保留。用来转化细胞的合适的和优选的多核苷酸如此处关于合适的和优选的植物EG307 or EG1117多核苷酸本身所公开的。本发明的重组细胞中包含的特别优选的多核苷酸包括:SEQ ID NO:1,SEQ ID NO:91,SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:5,SEQID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ IDNO:14,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:24,SEQ IDNO:25,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ IDNO:30,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:34,SEQ IDNO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:45,SEQ IDNO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:50,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ IDNO:63,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:67,SEQ IDNO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:73,SEQ IDNO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:59,SEQ IDNO:78,SEQ ID NO:80,SEQ ID NO:81,SEQ ID NO:82,SEQ IDNO:84,和/或SEQ ID NO:85。本发明的重组细胞中包含的备选的优选多核苷酸包括:SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:97,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:101,SEQ ID NO:102,SEQ ID NO:103,SEQ ID NO:104,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:110,SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:124,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:128,SEQ ID NO:129,SEQ ID NO:130,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147,SEQ ID NO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162,SEQ ID NO:163,SEQ ID NO:165,SEQ ID NO:166,SEQ ID NO:167,和/或SEQ ID NO:168。
用于转化的合适的宿主细胞包括能够用本发明的多核苷酸转化的任何细胞。宿主细胞可以是未转化的细胞或者已经用至少一种多核苷酸转化的细胞。本发明的宿主细胞能够内源(即自然)地产生本发明的EG307或EG1117多肽,或者在用至少一种本发明的多核苷酸转化后能够产生这种多肽。本发明的宿主细胞可以是能够产生至少一种本发明的多肽的任何细胞,包括细菌、真菌(包括酵母和稻瘟病,Magnaporthe grisea)、寄生虫(包括线虫,特别是剑线虫属(Xiphinema)、螺旋线虫属(Helicotylenchus)和矮化线虫属(Tylenchlohynchus))、昆虫、其它动物和植物细胞。
用于转化的合适的宿主病毒包括能够用本发明的多核苷酸转化的任何病毒,包括但不限于水稻条纹枯叶病毒和echinochloa hoja blanca病毒。
在一个优选实施方案中使用在植物组织内能够存活并复制的非致病共生细菌,即所谓的内生植物,或能够在根际叶隙定居的非致病共生细菌,即所谓的附生植物。这些细菌包括农杆菌属(Agrobacterium)、产碱菌属(Alcaligenes)、固氮螺菌属(Azospirillum)、固氮菌属(Azotobacter)、芽孢杆菌属(Bacillus)、棍状杆菌属(Clavibacter)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、黄杆菌属(Flavobacter)、克雷伯氏菌属(Klebsiella)、假单胞菌属(Pseudomonas)、根瘤菌属(Rhizobium)、沙雷氏菌属(Serratia)、链霉菌属(Streptomyces)和黄单胞菌属(Xanthomonas)的细菌。共生真菌,如木霉属(Trichoderma)和粘帚霉属(Gliocladium)也可能是为了同一目的表达本发明的核苷酸序列的宿主。
重组细胞优选地通过用一种或多种重组分子转化宿主细胞产生,每一种分子均包含本发明的一种或多种多核苷酸,这些多核苷酸与含有一个或多个转录控制序列的表达载体有效连接。短语“有效连接”是指一种多核苷酸插入一种表达载体中,使得该分子在转化宿主细胞时能够在正确的阅读框内表达。如此处所用的,表达载体是能够转化宿主细胞和实现指定多核苷酸表达的DNA或RNA载体。优选地,表达载体也能够在宿主细胞内复制。表达载体可以是原核或真核的,一般是病毒或质粒。本发明的表达载体包括在本发明的重组细胞(包括细菌、真菌、寄生虫、昆虫、其它动物和植物细胞)中起作用(即直接基因表达)的任何载体。本发明优选的表达载体可以在细菌、酵母、真菌、昆虫和哺乳动物细胞中、优选地在以上公开的细胞型中直接基因表达。
本发明的重组分子也可以(a)含有分泌信号(即信号片段核酸序列),使得表达的本发明的EG307或EG1117多肽能够从产生该多肽的细胞中分泌,和/或(b)含有融合序列,使本发明的多核苷酸表达为融合多肽。适当的信号片段和融合片段核酸编码的融合片段的例子在此公开。真核重组分子可包含在本发明的多核苷酸的核酸序列周围和/或之内的间插和/或非翻译序列。适当的信号片段包括能够指导本发明的多肽分泌的天然信号片段或任何异源信号片段。用来增强器官和细胞器特异性表达的优选的信号和融合序列包括但不限于arcelin-5,参见Goossens,A.等人。菜豆(Phaseolus vulgaris)的arcelin-5基因指导在转基因Phaseolus acutifolius和拟南芥植物中高种子特异性的表达.Plant Physiology(1999)120:1095-1104,菜豆蛋白,参见Sengupta-Gopalan,C.等人,菜豆β-菜豆蛋白基因在烟草种子中发育调节的表达.PNAS(1985)82:3320-3324,富含羟脯氨酸的糖蛋白,丝氨酸蛋白酶抑制剂(serpin),参见Yan,X.等人,信号序列与修饰的β-葡糖醛酸糖苷酶基因的基因融合导致β-葡糖醛酸糖苷酶蛋白在分泌途径/质膜中的保留.Plant Physiology(1997)115:915-924,N-乙酰氨基葡糖转移酶1,参见Essl,D.等人,来自烟草N-乙酰葡糖胺基转移酶I的N端77个氨基酸足以在Nicotiana benthamiana细胞的高尔基体中保留报道蛋白质.Febs Letters(1999)453(1-2):169-73,白蛋白,参见Vandekerckhove,J.等人,利用修饰的2S种子贮存蛋白质在转基因植物中产生内啡肽.BioTechnology 7:929-932(1989)和PR1,参见Pen,J.等人,活性工业酶在植物中的高效生产.Industrial Crops and Prod.(1993)1:241-250。
本发明的多核苷酸能够与含有调节序列的表达载体有效连接,这些调节序列如转录控制序列、翻译控制序列、复制起点和与重组细胞相容并且控制本发明的多核苷酸表达的其它调节序列。具体而言,本发明的重组分子包含转录控制序列。转录控制序列是控制转录起始、延伸和终止的序列。包括那些转录控制序列,它们足以使启动子依赖的基因表达可以细胞型特异的、组织特异的控制,或者可以被外部信号或试剂诱导;这些元件可位于天然基因的5′或3′区。特别重要的转录控制序列是控制转录起始的序列,如启动子、增强子、操纵基因和抑制序列。合适的转录控制序列包括能够在至少一种本发明的重组细胞中起作用的任何转录控制序列。本领域技术人员公知多种这样的转录控制序列。优选的转录控制序列包括在细菌、酵母、真菌、昆虫和哺乳动物细胞中起作用的序列,例如但不限于:tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、噬菌体lambda(λ)(如λpL和λpR和包含这些启动子的融合体)、噬菌体T7、T71ac、噬菌体T3、噬菌体SP6、噬菌体SP01、金属硫蛋白、α-交配因子、毕赤酵母乙醇氧化酶、甲病毒亚基因组启动子(如辛德毕斯病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、美洲棉铃虫昆虫病毒、痘苗病毒、疱疹病毒、痘病毒、腺病毒、巨细胞病毒(如直接早期启动子、猿猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复片段、劳斯肉瘤病毒、热休克、磷酸盐和硝酸盐转录控制序列,以及能够控制原核或真核细胞中的基因表达的其它序列。
特别优选的转录控制序列是植物转录控制序列。转录控制序列的选择根据表达的时间和空间需要而不同,也取决于靶种。因此,本发明的核苷酸序列在任何植物器官(叶、根、幼苗、未成熟的或成熟的繁殖结构等)中或在任何植物发育阶段的表达是优选的。尽管来自双子叶植物的多种转录控制序列在单子叶植物中显示有效,反之亦然,但是理想的是在双子叶植物中表达选择双子叶植物转录控制序列,在单子叶植物中表达选择单子叶植物启动子。然而,选择的转录控制序列的来源没有限制;只要它们能够引导核苷酸序列在希望的细胞中表达就足够了。
组成型表达的优选转录控制序列包括但不限于来自编码肌动蛋白或遍在蛋白的基因的启动子和CaMV 35S和19S启动子。本发明的核苷酸序列也能够在化学调节启动子的调节下表达。这使得当用诱导化学试剂处理作物时,只有EG307或EG1117多肽能够合成。化学诱导基因表达的优选技术在公开的申请EP0 332 104(授予Ciba-Geigy)和美国专利号5,614,395中详细描述。一种优选的化学诱导启动子是烟草PR-1a启动子。
优选的一类启动子是被植物的生理状态(即创伤诱导、水应激诱导、盐应激诱导、疾病诱导等)诱导的启动子。已经描述了在创伤部位以及植物病原体感染部位表达的大量启动子。理想地,这种启动子应当只在感染部位局部有活性,这样,EG307或EG1117多肽只在希望积累的细胞中积累。优选的这类启动子包括以下所述:Stanford等人Mol.Gen.Genet.215:200-208(1989),Xu等人Plant Molec.Biol.22:573-588(1993),Logemann等人Plant Cell 1:151-158(1989),Rohrmeier和Lehle,Plant Molec.Biol.22:783-792(1993),Firek等人Plant Molec.Biol.22:129-142(1993),和Warner等人Plant J.3:191-201(1993)。
优选的组织特异性表达模式包括但不限于绿色组织特异的、根特异的、茎特异的和花特异的。适于在绿色组织中表达的启动子包括调节参与光合作用的基因的多种启动子和从单子叶植物和双子叶植物中克隆的多种启动子。一种优选的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth和Grula,Plant Molec.Biol.12:579-589(1989))。根特异性表达的一种优选启动子是de Framond(FEBS290:103-106(1991);授予Ciba-Geigy的EP0 452 269)所述的。一种优选的茎特异性启动子是美国专利号5,625,136(授予Ciba-Geigy)所述,它引导玉米trpA基因的表达。
本发明的一种重组分子是可能包含上述任何多核苷酸至少之一的分子,该多核苷酸至少与能够有效调节该多核苷酸在转化细胞中表达的任何转录控制序列之一有效连接,它们的例子在此公开。
本发明的重组细胞包括至少用本发明的任何多核苷酸之一转化的任何细胞。合适的和优选的多核苷酸以及转移到细胞中的合适的和优选的重组分子在此公开。
本发明的重组细胞也能够用包含植物EG307或EG1117多核苷酸的一种或多种重组分子共转化,这些多核苷酸编码一种或多种本发明的多肽和一种或多种在植物中表达时有用的其它多肽。
本领域技术人员应当理解,使用重组DNA技术能够提高转化的多核苷酸的表达,方法是例如操作该多核苷酸在宿主细胞内的拷贝数,该多核苷酸的转录效率,获得的转录物的翻译效率,以及翻译后修饰的效率。可用于提高本发明的多核苷酸表达的重组技术包括但不限于:有效连接多核苷酸与高拷贝数质粒,向一种或多种宿主细胞染色体内整合多核苷酸,向质粒内添加载体稳定序列,转录控制信号(例如启动子、操纵基因、增强子)的置换或修饰,翻译控制信号(例如核糖体结合位点、Shine-Dalgarno序列)的置换或修饰,为了符合宿主细胞的密码子使用,修饰本发明的多核苷酸,删除去稳定转录物的序列,以及在发酵过程中使用在时间上分开重组细胞生长与重组酶产生的控制信号。破碎、修饰或衍生编码这种多肽的多核苷酸可以提高表达的本发明的重组多肽的活性。
本发明的重组细胞能够用来生产一种或多种本发明的多肽,方法是在有效产生这种多肽的条件下培养这些细胞,并回收该多肽。生产多肽的有效条件包括但不限于允许多肽产生的合适的培养基、生物反应器,温度、pH和氧气条件。合适的或有效的培养基是指本发明的细胞在其中培养时能够产生本发明的EG307或EG1117多肽的任何培养基。这种培养基一般是含有可同化的碳、氮和磷酸源以及合适的盐、矿物质、金属和其它养分(如维生素)的水培养基。该培养基可含有复合养分,或者可以是已知成分的基本培养基。本发明的细胞能够在常规发酵生物反应器中培养,包括但不限于分批、补料分批、细胞再循环和连续发酵罐。培养也能够在摇瓶、试管、微量滴定皿和培养皿中进行。以适于重组细胞的温度、pH和氧含量进行培养。本领域技术人员了解这些培养条件。
根据用于生产的载体和宿主系统,产生的本发明的多肽可以保留在重组细胞内;分泌到发酵培养基内;分泌到两层细胞膜之间的间隙内,如大肠杆菌的周质间隙;或者保留在细胞或病毒膜的外表面上。
短语“回收多肽”仅仅是指收集含有该多肽的全部发酵培养基,不需要其它分离或纯化步骤。本发明的多肽能够用多种标准多肽纯化技术纯化,例如但不限于:亲和层析、离子交换层析、过滤、电泳、疏水相互作用层析、凝胶过滤层析、反相层析、伴刀豆球蛋白A层析、色谱焦聚和差示溶解(differential solubilization)。本发明的多肽优选地以“基本纯”的形式获取。如此处所用的“基本纯”是指允许有效使用该多肽作为诊断或检测化合物的纯度,是指随着偏性增加,至少50%、60%、70%、80%、90%、95%或98%同源。
F.转染的植物细胞和转基因植物
对于EG307和EG1117,特别优选的重组细胞是植物细胞。“植物细胞”是指用半透膜限制并且含有质体的任何自体繁殖细胞。如果希望进一步繁殖,这种细胞也需要细胞壁。如此处所用的植物细胞包括但不限于:藻类、蓝细菌、种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。
在一个特别优选的实施方案中,至少一种(或两种)本发明的EG307或EG1117多肽或其等位基因或突变形式在高等生物(如植物)中表达。在这种情况下,表达有效量的多肽的转基因植物显示经济生产力提高。本发明的一种核苷酸序列插入一种表达盒内,然后优选地稳定整合到该植物的基因组中。在另一个优选实施方案中,核苷酸序列包含于一种非致病性自复制病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,包括但不限于:玉米、小麦、大麦、黑麦、粟、鹰嘴豆、小扁豆、亚麻、橄榄、无花果、杏、开心果、胡桃、甜菜、防风草、柑桔类水果,包括但不限于:桔子、柠檬、酸橙、葡萄柚、红桔、minneola和桔柚、红薯、菜豆、豌豆、菊苣、莴苣、卷心菜、花椰菜、花茎甘蓝、芜菁、小萝卜、菠菜、芦笋、洋葱、蒜、胡椒、芹菜、倭瓜、南瓜、大麻、夏南瓜、苹果、梨、榅桲、甜瓜、李子、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉、大豆、西红柿、高粱、甘蔗、甜菜、向日葵、油菜籽、三叶草、烟草、胡萝卜、棉花、紫花苜蓿、水稻、马铃薯、茄子、黄瓜、拟南芥,和木本植物,如针叶树和落叶树。
一旦希望的核苷酸序列转化一个具体植物种,即可以使用传统繁育技术在该种中繁殖,或者转移到同一种的其它品种中,尤其包括商业品种。
因此,本发明提供一种生产转基因植物细胞或转基因植物的方法,包括下列步骤:a)转染一种植物细胞,使之含有一种异源DNA片段,该片段编码一种蛋白质且来源于不是该细胞天然的EG307和/或EG1117多核苷酸(该多核苷酸实际上是天然的,但是表达模式可能在发育上改变,仍然导致优选的效果);其中该多核苷酸与能够有效用于转基因蛋白质表达的一个启动子有效连接;b)任选地在由其再生为转基因植物的条件下培养并保持该细胞;c)任选地在该DNA表达的条件下生长该转基因植物,因此该植物中EG307和/或EG1117多肽的总量改变。在一个优选实施方案中,该方法还包括获得及生长该转基因植物的其它几代后代的步骤,它们含有所述异源DNA片段,其中该异源DNA片段表达。如此处所用的“异源DNA”,或者在有些情况下的“转基因”,是指外源基因或多核苷酸,或天然或内源基因或多核苷酸的其它或修饰形式(也许由不同启动子驱动),以用特异性的方式改变植物的性状。
本发明也提供含有编码EG307和/或EG1117多肽的异源DNA的植物细胞。在一个优选实施方案中,转基因植物细胞是转基因植物的繁殖材料。本发明也提供转染的宿主细胞,包括用一种构建体转染的宿主细胞,该构建体含有启动子、增强子或来自进化上显著的EG307和/或EG1117多核苷酸的内含子多核苷酸,和编码一种报道蛋白的多核苷酸。
本发明也提供一种提高植物的经济生产力的方法,包括:a)产生一种转染的植物细胞,其含有编码EG307和/或EG1117多肽的转基因,因此EG307和/或EG1117在该植物中的表达改变;和b)由转染的植物细胞生长为转基因植物,其中EG307和/或EG1117转基因在该转基因植物中表达。转基因的表达包括EG307和/或EG1117表达的增加。在有些实施方案中,转基因的表达产生一种RNA,该RNA可干扰天然EG307和/或EG1117基因,使得天然基因的表达消除或减少,导致有用的结果。
本发明也提供一种转基因植物,其含有编码EG307和/或EG1117多肽的异源DNA,它在植物组织中表达,包括在导入植物内的载体中表达。
本发明也提供一种分离的多核苷酸,其包含与植物组织中编码EG307和/或EG1117基因的多核苷酸有效连接的转录控制元件。在优选实施方案中,转录控制元件是对于EG307和/或EG1117基因天然的启动子。
本发明也提供一种制备转染的细胞的方法,包括:a)鉴定驯化植物中一种进化上显著的EG307和/或EG1117多核苷酸;b)利用该EG307和/或EG1117多核苷酸鉴定一种非多肽编码序列,可以是转录或翻译调节元件、增强子、内含子或其它5′或3′侧翼序列;c)装配一种构建体,其含有非多肽编码序列和编码一种报道蛋白的多核苷酸;和d)用该构建体转染一种宿主细胞。本发明也提供根据该方法产生的转染的细胞。在一个实施方案中,宿主细胞是一种植物细胞,该方法还包括在适于再生转基因植物的条件下培养及保持细胞的步骤。也提供利用该方法产生的转基因植物。
本发明的一种核苷酸序列优选地在转基因植物中表达,从而导致相应的EG307和/或EG1117多肽在转基因植物中生物合成。这样,产生具有与经济生产力提高有关的特征的转基因植物。为了在转基因植物中表达,本发明的核苷酸序列可能需要修饰和优化。尽管优选的基因序列可以在单子叶植物和双子叶植物种中充分表达,但是能够修饰这些序列来解决单子叶植物或双子叶植物的特定密码子偏性和GC含量偏性,因为已经显示这些偏性不同(Murray等人Nucl.Acids Res.17.477-498(1989))。需要在核苷酸序列内进行的所有改变,如上所述,均使用公开的专利申请EP0 385 962(Monsanto)、EP0 359 472(Lubrizol)和WO93/07278(Ciba-Geigy)所述的方法,利用众所周知的定点诱变、PCR和合成基因构建技术进行。
为使翻译有效起始,与起始甲硫氨酸相邻的序列可能需要修饰。例如,它们能够通过包含已知在植物中有效的序列加以修饰。Joshi建议了用于植物的一种合适的共有序列(NAR15:6643-6653(1987)),Clontech建议了另外一种共有翻译起始子(1993/1994目录,210页)。这些共有序列适于本发明的核苷酸序列使用。这些序列掺入含有该核苷酸序列的构建体内,可达及包含ATG(而使第二个氨基酸不修饰),或者另外可达及包含ATG之后的GTC(具有修饰转基因的第二个氨基酸的可能性)。
核苷酸序列在转基因植物中的表达由显示在植物中起作用的转录控制元件驱动。用一种在这些调节元件控制下的多核苷酸转化植物导致转化植物中受控制的表达。这些转录控制元件如上所述。除了选择合适的转录起始子之外,为了在植物中表达EG307和/或EG1117多肽,构建需要一个合适的转录终止子与异源核苷酸序列的下游连接。本领域可以获得并公知几种这样的终止子(例如来自CaMV的tm1,来自rbcS的E9)。在本发明上下文中能够使用已知在植物中起作用的任何合适的终止子。
多种其它序列能够掺入本发明所述的表达盒中。包括显示可增强表达的序列,如内含子序列(例如来自Adhl和bronzel)和病毒前导序列(例如来自TMV、MCMV和AMV)。
本发明也提供一种提高植物产量的方法,包括:a)产生一种转基因植物细胞,其含有编码EG307和/或EG1117多肽的一种转基因,该转基因在适于控制表达基因的调节序列的控制下;和b)由转基因植物细胞生长为转基因植物,其中EG307和/或EG1117转基因在该转基因植物中表达。
本发明也提供一种提高植物产量的方法,包括:a)产生含有一种转基因的一种转染的植物细胞,该转基因含有EG307和/或EG1117基因,处于导致EG307和/或EG1117基因组成型表达的启动子控制下;和b)由转基因植物细胞生长为转基因植物,其中EG307和/或EG1117转基因在该转基因植物中组成型表达。
本发明也提供在转基因植物中导致可控产量的一种方法,包括:a)产生含有一种转基因的一种转染的植物细胞,该转基因含有EG307和/或EG1117基因,处于导致EG307和/或EG1117基因可控表达的启动子控制下;和b)由转基因植物细胞生长为转基因植物,其中EG307和/或EG1117转基因在该转基因植物中可控表达。在一个实施方案中,使用组织特异性、细胞型特异性启动子,或者通过引入外部信号或试剂(如化学信号或试剂)激活的启动子,表达EG307和/或EG1117基因。
优选地将本发明的核苷酸序列的表达靶向植物中不同的细胞位置。在有些情况下,定位于细胞溶质中可能是希望的,而在其它情况下,定位于一些亚细胞器中可能是优选的。异源DNA编码的多肽的亚细胞定位利用本领域公知的技术进行。一般而言,操作编码来自已知细胞器靶向的基因产物的靶肽的DNA,并与核苷酸序列的下游融合。对于叶绿体,已知许多这样的靶序列,它们在异源构建中的作用已经显示。本发明的核苷酸序列的表达也靶向宿主细胞的内质网或液泡。其实现方法在本领域公知。
适于植物转化的载体在本申请书其它部分描述。对于农杆菌介导的转化,二元载体或携带至少一种T-DNA边界序列的载体是合适的,而对于直接基因转移,任何载体都是合适的,仅含目的构建的线性DNA可能是优选的。在直接基因转移的情况下,能够采取用一种DNA种转化或共转化(Schocher等人Biotechnology 4:1093-1096(1986))。对于直接基因转移和农杆菌介导的转移,通常(但不是必须)用可提供抗生素(卡那霉素、潮霉素或氨甲喋呤)或除草剂(basta)抗性的选择性标记物进行转化。然而,选择性标记物的选择不是本发明的关键。
在另一个优选实施方案中,本发明的核苷酸序列直接转化质体基因组。质体转化的一个主要优点是质体能够在一个启动子控制下表达多个开放阅读框。质体转化技术在美国专利号5,451,513、5,545,817和5,545,818、PCT申请号WO95/16783和McBride等人(1994)Proc.Natl.Acad.Sci.USA91,7301-7305中广泛描述。叶绿体转化的基本技术包括向合适的靶组织中导入克隆的质体DNA位于选择性标记侧翼的区域,以及目的基因,例如使用biolistics或原生质体转化(例如氯化钙或PEG介导的转化)。1-1.5kb侧翼区,被称为靶向序列,有利于与质体基因组的同源重组,因此允许质体基因组(plastome)的特定区域的置换或修饰。最初,利用提供大观霉素和/或链霉素抗性的叶绿体16S rRNA和rps12基因中的点突变作为转化的选择性标记(Svab,Z.,Hajdukiewicz,P.和Maliga,P.(1990)Proc.Natl.Acad.Sci.USA87,8526-8530;Staub,J.M.和Maliga,P.(1992)Plant Cell 4,39-45)。这产生稳定的同质转化子,频率约为每100次靶叶轰击一个转化子。这些标记之间存在克隆位点允许产生质体靶向载体,用于导入外源基因(Staub,J.M.和Maliga,P.(1993)EMBO J.12,601-606)。将隐性rRNA或r-多肽抗生素抗性基因替换为一种显性选择性标记,编码大观霉素解毒酶氨基葡糖苷-3’-乙酰转移酶的细菌aadA基因,可使转化频率大大提高(Svab,Z.和Maliga,P.(1993)Proc.Natl.Acad.Sci.USA90,913-917)。以前,这种标记已经成功用于绿藻莱因哈德衣藻(Chlamydomonas reinhardtii)的质体基因组的高频率转化(Goldschmidt-Clermont,M.(1991)Nucl.Acids Res.19:4083-4089)。本领域公知可用于质体转化的其它选择性标记,包括在本发明的范围内。一般而言,转化后大约需要15-20次细胞分裂循环才能达到同质体(homoplastidic)状态。质体表达,其中通过同源重组将基因插入每个植物细胞中存在的所有几千个拷贝的环状质体基因组中,利用优于核表达基因的大量拷贝数的优点,使得表达水平能够轻易地超过可溶性总植物多肽的10%。在一个优选实施方案中,本发明的核苷酸序列插入质体靶向载体中,转化希望的植物宿主的质体基因组。获得对于含有本发明的核苷酸序列的质体基因组而言同质的植物,优先能够高表达该核苷酸序列。
本发明也提供一种鉴定与植物产量有关的基因的方法,包括:a)提供一种植物组织样品;b)向植物组织样品内导入一种候选的与植物产量有关的基因;c)在植物组织样品内表达候选的与植物产量有关的基因;和d)确定植物组织样品是否显示产量反应改变,因此反应的改变鉴定一种与植物产量有关的基因。本发明也提供根据该方法分离的与植物产量有关的基因。
如此处所用的产量反应用本领域技术人员公知的技术测定。对于谷类,例如,使用下列一种或多种计量测定产量反应:粒重、粒长、粒重/1000粒、圆锥花序大小、圆锥花序数和谷粒/圆锥花序数。
G.EG307或EG1117抗体
本发明也包括能够与本发明的EG307或EG1117多肽或其模拟位选择性结合的分离的抗体。这些抗体在此也被称为抗EG307或抗EG1117抗体。该实施方案特别优选的抗体包括抗稻EG307抗体、抗O.rufipogon EG307抗体、抗Z.mays EG307抗体、抗稻EG1117抗体、抗O.rufipogon EG1117抗体、抗Z.mays EG117抗体。
分离的抗体是从其自然环境中分离的抗体。术语“分离的”不是指这些抗体的纯度状态。因此,分离的抗体可能包括含有这些抗体的抗血清,或以不同程度纯化的抗体。
如此处所用的术语“选择性结合”是指本发明的抗体优先结合本发明的指定多肽及其模拟表位的能力。结合能够用本领域技术人员公知的多种方法测定,包括免疫印迹测定、免疫沉淀测定、放射免疫测定、酶免疫测定(例如ELISA)、免疫荧光抗体测定和免疫电子显微镜检查;参见,例如:Sambrook等人,同上,Harlow和Lane,1990,同上。
本发明的抗体可以是多克隆或单克隆抗体。本发明的抗体包括功能相当物,如抗体片段和基因工程抗体,包括能够与用来获得抗体的多肽或模拟表位的至少一个表位选择性结合的单链抗体。本发明的抗体也包括能够结合一个以上表位的嵌合抗体。产生的优选的抗体针对本发明的多核苷酸编码(至少部分编码)的多肽或其模拟表位。
生产本发明的抗体的一种优选方法包括:(a)对动物施用有效量的本发明的多肽或其模拟表位,产生抗体,和(b)回收该抗体。在另一种方法中,利用如前公开的生产本发明的EG307或EG1117多肽的技术重组生产本发明的抗体。
本发明的抗体在本发明的范围内具有多种可能的用途。例如,这些抗体能够用作测定试剂,检测植物的EG307或EG1117表达,和/或(b)作为工具筛查表达文库,和/或从多肽与其它污染物的混合物中回收希望的本发明的多肽。此外,为了直接杀死这些植物,也能够用本发明的抗体使细胞毒性剂靶向植物。利用本领域技术人员公知的技术,将这些抗体与细胞毒性剂偶联(即稳定连接),能够实现靶向。本领域技术人员公知合适的细胞毒性剂。合适的细胞毒性剂包括但不限于:双链多肽(即具有A链和B链的毒素),如白喉毒素、蓖麻蛋白毒素、假单胞菌外毒素、modeccin毒素、相思豆毒蛋白毒素和志贺菌毒素;单链毒素,如商陆抗病毒多肽、α-鹅膏毒环肽和核糖体抑制多肽;和化学毒素,如苯丙氨酸氮芥(melphalan)、氨甲喋呤、氮芥、阿霉素和柔红霉素。优选的双链毒素经过修饰包含毒素的毒性域和转位域,但是缺乏毒性内部的细胞结合域。
H.生长促进组合物的配制
本发明也包括含有本发明的EG307或EG1117多肽中至少一种或两种的组合物。为了有效控制生长,这些组合物优选地含有足量的多肽。根据靶作物和环境条件,如湿度、温度或土壤类型,其含量不同。在一个优选实施方案中,含有EG307和/或EG1117多肽的组合物包含表达该多肽的宿主细胞,没有另外纯化。在另一个优选实施方案中,表达EG307和/或EG1117多肽的细胞在用作生长促进剂之前冻干。在另一个实施方案中,改造EG307或EG1117多肽,使之从宿主细胞中分泌。当希望从表达该多肽的宿主细胞中纯化该多肽时,达到EG307或EG1117多肽的不同程度的纯化。
本发明还包括制备含有至少一种本发明的EG307或EG1117多肽的组合物,它们与此处所述的一种或多种化合物或一组化合物均匀混合。本发明也涉及处理植物的方法,包括对植物应用EG307或EG1117多肽或含有EG307或EG1117多肽的组合物。EG307或EG1117多肽能够以组合物的形式对作物地区应用,或者用其它化合物同时或连续处理植物。这些化合物可以是肥料或微量营养物的供体或影响植物生长的其它制品。它们也可能是选择性除草剂、杀虫剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂或几种这样的制品的混合物,必要时与配制领域常用的其它载体、表面活性剂或促进应用的佐剂一起使用。合适的载体和佐剂可以是固体或液体,对应于配制技术中常用的物质,例如天然或再生的矿物质、溶剂、分散剂、湿润剂、增粘剂、粘合剂或肥料。
本发明的一种优选的使用EG307或EG1117多肽的方法是向土壤、水或植物的叶子喷洒。施用次数和施用频率取决于植物的类型和希望提高的产量。EG307或EG1117多肽也能经由土壤通过根渗透到植物中(系统作用),方法包括用液体组合物浸透植物的局部,以固体形式对土壤施用化合物,例如以颗粒形式(土壤施用)。EG307或EG1117多肽也可以对种子施用(覆盖),方法包括用含有EG307或EG1117多肽的液体制剂渗透种子,或用固体制剂覆盖它们。在特殊情况下,其它施用类型也是可能的,例如选择性处理植物的茎或芽。
EG307或EG1117多肽以未修饰的形式使用,优选地与配制领域常用的佐剂一起使用,因此以公知的方法配制成可乳化的浓缩物、可覆盖(coatable)的糊,可直接喷洒或稀释的溶液,稀释的乳剂,可湿润的粉末,可溶性粉末,粉尘,颗粒,以及例如包封于聚合物中。如同组合物的性质,根据预期目的和主要环境选择施用方法,如喷洒、雾化、粉化、分散或倾注。
含有EG307或EG1117多肽,适当地含有固体或液体佐剂的制剂、组合物或制品,用公知的方法制备,例如均匀混合和/或研磨EG307或EG1117多肽与添加剂,例如溶剂,固体载体,以及适当时的表面活性化合物(表面活性剂)。
合适的溶剂包括芳香烃,优选地含有8-12个碳原子的部分,例如二甲苯混合物或取代的萘,邻苯二甲酸酯,如邻苯二甲酸二丁酯或邻苯二甲酸二辛酯,脂肪烃,如环己烷或石蜡,醇类和二醇类,及其醚和酯,如乙醇、乙二醇一甲基或一乙基酯,酮,如环己酮,强极性溶剂,如N-甲基-2-吡咯烷酮、二甲亚砜或二甲基甲酰胺,以及环氧化的植物油,如环氧化的椰子油或豆油或水。
例如用于粉尘和可分散粉末的固体载体通常是自然矿物质填料,如方解石、滑石粉、高岭土、蒙脱石或绿坡缕石。为了改善物理性质,也能添加高度分散的硅酸或高度分散的可吸附聚合物。合适的颗粒化吸附载体是多孔类型的,例如浮石粉、碎砖、海泡石或膨润土;合适的非吸附载体是如方解石或沙子的材料。另外,也能够使用大量无机或有机性质的预先颗粒化的材料,例如,特别是白云石或粉碎的植物残渣。
合适的表面活性化合物是具有良好乳化、分散和湿润性质的非离子、阳离子和/或阴离子表面活性剂。术语“表面活性剂”也被理解为含有表面活性剂的混合物。合适的阴离子表面活性剂可以是水溶性皂类或水溶性合成表面活性化合物。
合适的皂类是碱金属盐、碱土金属盐或高级脂肪酸(10-22个碳原子的链)的未取代的或取代的铵盐,例如油酸或硬脂酸的钠盐或钾盐,或者能够从如椰子油或动物油(tallow oil)中获得的天然脂肪酸混合物的钠盐或钾盐。也可以使用脂肪酸甲基牛磺酸盐。
然而,更常使用所谓的合成表面活性剂,特别是脂肪磺酸盐、脂肪硫酸盐、磺酸苯并咪唑衍生物或烷基芳基磺酸盐。
脂肪磺酸盐或硫酸盐通常是碱金属盐、碱土金属盐或未取代的或取代的铵盐的形式,含有8-22个碳的烷基,也包括烷基的烷基部分,例如可由天然脂肪酸获得的木质素磺酸、十二烷基硫酸或脂肪醇硫酸的钠盐或钙盐。这些化合物也含有硫酸酯的盐和脂肪醇的磺酸/环氧乙烷加合物。磺酸化的苯并咪唑衍生物优选地含有2个磺酸基团和一个含8-22个碳原子的脂肪酸基。烷基芳基磺酸盐的例子有十二烷基苯磺酸、二丁基萘磺酸或萘磺酸的钠、钙或三乙醇胺盐/甲醛缩合产物。相应的磷酸,例如对壬基酚与4-14摩尔环氧乙烷的加合物的磷酸酯盐,也是合适的。
非离子表面活性剂优选地是脂肪族或环脂族醇或饱和或不饱和脂肪酸和烷基酚的聚乙二醇乙醚衍生物,该衍生物在(脂肪族)烃部分含有3-30个乙二醇醚基团和8-20个碳原子,在烷基酚的烷基部分含有6-18个碳原子。
其它合适的非离子表面活性剂有聚环氧乙烷与聚丙二醇、乙二胺丙二醇和烷基聚丙二醇的水溶性加合物,烷基链中含有1-10个碳原子,该加合物含有20-250个乙二醇醚基团和10-100个丙二醇醚基团。这些化合物的每个丙二醇单元通常含有1-5个乙二醇单元。
非离子表面活性剂的代表性例子有壬酚聚乙氧基乙醇、蓖麻油聚乙二醇醚、聚丙烯/聚环氧乙烷加合物、三丁基苯氧基聚乙氧基乙醇、聚乙二醇和辛基苯氧基乙氧基乙醇。聚乙二醇山梨聚糖的脂肪酸酯和聚乙二醇山梨聚糖三油酸酯也是合适的非离子表面活性剂。
阳离子表面活性剂优选地是季铵盐,其含有至少一个C8-C22烷基作为N-取代基,和低等未取代的或卤代烷基、苄基或低等羟烷基作为其它取代基。这些盐优选地是卤化物、甲基硫酸盐或乙基硫酸盐的形式,例如硬脂酰三甲基氯化铵或苄基二(2-氯乙基)乙基溴化铵。配制领域常用的表面活性剂如下所述:《McCutcheon去污剂和乳化剂手册》,MC Publishing Corp.Ringwood,N.J.,1979,Sisely和Wood,《表面活性剂大全》(Encyclopedia of Surface Active Agents),ChemicalPublishing Co.,Inc.New York,1980。
IV.在中性条件下进化的基因的鉴定
如此处所详述,KA/KS分析允许鉴定阳性选择的蛋白质编码基因;然而,这类分析也能用来鉴定另一类进化上显著的基因,这些基因在中性条件下进化。
KA/KS比>1预示阳性选择的作用,而相反,KA/KS比<1提示蛋白质编码基因已经阴性选择(即保守)。如此处所述,大多数基因(实际上绝大多数)都保守。只有少数基因显示KA/KS比>1,因为极少数基因阳性选择。如此处所述,在谷类(以及其它作物)驯化过程中被阳性选择的基因具有显著的商业价值;然而,驯化植物中含有的另一类基因既没有被阳性选择(在驯化后代中产生希望的、增强的性状)也没有阴性选择(保守)。如上所述,这一亚类植物基因也具有显著的商业价值,这类基因能够用此处所述的KA/KS分析鉴定。
这些基因包括使植物抵抗干旱、疾病、害虫(包括但不限于昆虫、食植动物和微生物)、高盐水平和其它应激的基因。遭受害虫攻击、干旱或高盐水平损害等等,使农民、种子公司和大型农业公司一年损失几十亿美元,因此,鉴定使野生植物抵抗这些应激的基因具有重要的社会(对于饥饿的世界)和经济意义。
检测这些基因的方法如下。在植物第一次驯化后(随后,当后代进一步驯化时),它们被“娇养(pampered)”,例如,人类供应充足的水分来满足植物的需要。因此,植物不需要“自己”应对干旱应激。类似地,人类消灭昆虫害虫(用物理方法或通过使用杀虫剂),使驯化的植物远离食植动物,以致驯化的植物不会经常面临对付这些害虫。实际上,已经证实,例如,驯化的谷类对干旱、高盐水平、害虫和其它应激通常比其野生亲本/祖先更脆弱。这是因为生物通常不会保持生存不需要的能力。由于人类接管了这些作用,驯化的植物能够节省保持编码应激相关性状的基因的高代谢成本(“代谢浪费”)。
这种抗性的损失肯定来源于祖先与其娇养的驯化后代之间的遗传差异(即改变)。导致功能丧失的这些遗传改变能够通过三个不同的机制发生。后代作物的基因组中实际上可能丢失了编码这些性状的基因。基因的丢失已经得到证实,是一种众所周知的现象。类似地,在后代作物中编码“不需要的”性状的基因仍然可能存在于基因组中,但是由于例如启动子改变,而不再表达。此外,编码这些不需要的性状的基因仍然可以是基因组的一部分,仍然可以表达,但是这些基因可能含有积累的核苷酸置换,使得蛋白质产物没有功能性或者比祖先同源物功能性更差。这些基因因此中性进化。
中性氨基酸置换在没有选择压力(阳性或阴性)的基因的蛋白质产物中积累。对于不需要保持目的基因的功能蛋白质产物的驯化植物,存在分子中性条件。包括编码如害虫、疾病、干旱、盐等抗性的性状的基因。这些完全不受限制的中性进化的基因是利用KA/KS分析检测的完美候选者,因为当比较来自祖先和后代植物的同源物时,中性进化的基因理想地显示KA/KS比=1。
因此,在此发明的和描述的方法包括祖先植物的cDNA文库的高通量测序,对来自现代后代的数据库BLASTING搜索EST,以及对同源对进行KA/KS分析。对于阳性选择的基因,该方法的细节在本专利其它部分说明。KA/KS比=1的基因是控制重要应激抗性性状的一组基因,利用这一比值能够有效、快速地鉴定这些基因。有商业价值的这一组基因包括编码希望的性状的基因,如害虫、疾病、干旱、高盐水平抗性等。为了最好地鉴定这些基因,对现代驯化的和祖先的种的EST测序应当以高精确度标准非常仔细地进行。人们能够利用GenBank中可以获得的谷类EST数据库,人们也可以从为此目的特别制备的cDNA文库中重新测序ESTs。测序的精确度是重要的,因为这将在祖先与KA/KS比=1的现代同源物之间产生极窄的基因对比较分布。这将使假阳性的数量减至最少,从而加快了该方法。
当筛选方法的精确度未严格控制或未知时,测序错误有可能模糊了1.0的KA/KS比,为此,仔细检查约0.75-1.25的KA/KS值,作为中性进化的证据。
在中性条件下进化的多核苷酸然后能在已知数量性状基因座之一或QTL上作图,从而可以快速、明确地鉴定该多核苷酸控制的具体应激抗性性状。
V.用于试剂鉴定的筛选方法
本发明也提供使用以上述方法鉴定及表征的多核苷酸和多肽的筛选方法。这些筛选方法可用于鉴定如下试剂,这些试剂可调节多核苷酸或多肽的功能,可用于提高或减少驯化的或祖先生物的特征。这些方法通常需要至少一种待测试剂接触一种驯化生物、祖先生物或转基因生物或用上述方法鉴定的多核苷酸序列或这些多核苷酸序列编码的多肽制品转染的细胞,其中根据调节多核苷酸序列或多肽的功能的能力鉴定试剂。例如,一种试剂可以是施加于或接触一种驯化植物或动物的化合物,在希望的时间诱导鉴定的基因的表达。特别是对于植物,例如能够使用一种试剂在适当的时间诱导开花。
如此处所用的术语“试剂”是指生物或化学化合物,如简单或复杂的有机或无机分子、肽、蛋白质或寡核苷酸。能够合成一大批化合物,例如寡聚物,如寡肽和寡核苷酸,和以不同核心结构为基础的合成有机和无机化合物,它们也包括于术语“试剂“中。另外,多种自然来源能够提供化合物进行筛选,如植物或动物提取物,等等。化合物能够单独或互相组合地检测。
“调节一种多核苷酸或多肽的功能”是指与不添加一种试剂相比,该多核苷酸或多肽的功能改变。调节可以在影响功能的任何水平上发生。一种多核苷酸或多肽功能可以是直接的或间接的,可以直接或间接测定。多核苷酸的“功能”包括但不限于:复制、翻译和表达模式。多核苷酸功能也包括与该多核苷酸内编码的多肽有关的功能。例如,一种试剂,其作用于多核苷酸并影响蛋白质的表达、构象、折叠(或其它物理特性)、与其它部分(如配体)的结合、活性(或其它功能特征)、调节和/或蛋白质结构或功能的其它方面,被认为具有调节的多核苷酸功能。一种有效试剂能够用来调节多核苷酸表达的方法包括但不限于:1)修饰转录因子与多核苷酸中转录因子反应元件的结合;2)修饰多核苷酸表达所必需的两种转录因子之间的相互作用;3)改变多核苷酸表达所必需的转录因子进入核内的能力;4)抑制与多核苷酸转录有关的转录因子的激活;5)修饰一种细胞表面受体,该受体通常与一种配体相互作用,它与配体的结合导致该多核苷酸的表达;6)抑制导致多核苷酸表达的信号传导级联的一种成分的灭活;和7)增强与多核苷酸转录有关的一种转录因子的激活。
多肽的“功能”包括但不限于:构象,折叠(或其它物理特性),与其它部分(如配体)的结合,活性(或其它功能特性),和/或蛋白质结构或功能的其它方面。例如,一种试剂,其作用于一种多肽并影响其构象、折叠(或其它物理特性)、与其它部分(如配体)的结合、活性(或其它功能特征)和/或蛋白质结构或功能的其它方面,被认为具有调节的多肽功能。一种有效试剂能够用来调节多肽功能的方法包括但不限于:1)改变构象、折叠或其它物理特性;2)改变与其天然配体的结合强度,或改变与配体结合的特异性;和3)改变多肽的活性。
将要筛选的试剂的选择通常由几个参数支配,如具体的多核苷酸或多肽靶标、了解的功能、三维结构(已知或推测的)和原理化合物设计的其它方面。也能够利用组合化学的技术生产大量候选物。本领域技术人员能够设计和/或获得合适的试剂进行检测。
此处所述的体内筛选测定可能比常规药物筛选测定有几个优点:1)如果一种试剂必须进入细胞才能获得希望的治疗效果,体内测定能够指出该试剂是否能够进入细胞;2)体内筛选测定能够鉴定以下试剂,该试剂以加入测定系统中的状态不能引发与多核苷酸或多肽功能调节有关的至少一个特征,但是一旦以成为有效试剂的方式进入细胞内,即由细胞成分修饰;3)最重要的是,体内测定系统允许鉴定可影响一种途径的任何成分的试剂,该途径最终导致与多核苷酸或多肽功能有关的特征。
筛选通常如下进行:向以本发明的方法鉴定的多核苷酸转染的适当细胞样品中加入一种试剂,监测该该多核苷酸或多核苷酸内编码的多肽的功能的影响,即调节。该实验优选地包括未接受候选试剂的对照样品。然后用任何合适的表型标准比较处理的和未处理的细胞,包括但不限于显微镜分析、生存力测试、复制能力、组织学检查、与细胞结合的具体RNA或多肽水平、细胞或细胞裂解物表达的酶活性水平、当暴露于传染物时细胞的相互作用,以及细胞与其它细胞或成分相互作用的能力。处理的与未处理的细胞之间的差异显示候选试剂引起的影响。该试剂最好对实验细胞比对对照细胞有更大的影响。合适的宿主细胞包括但不限于真核细胞,优选地植物或动物细胞。细胞的选择至少部分取决于预期的测定的性质。
为了检测上调多核苷酸表达的试剂,用目的多核苷酸转染一种合适的宿主细胞,使得该多核苷酸表达(在此使用时,表达包括转录和/或翻译),与一种待测试剂接触。一种试剂将检测导致mRNA和/或多肽表达增强的能力。制备载体和转染的方法在本领域公知。“转染”包括导入外源序列的任何方法,包括例如脂转染、转导、感染或电穿孔。外源多核苷酸可以作为非整合载体(如质粒)保持,或者可以整合到宿主基因组内。
为了鉴定特异激活转录的试剂,转录调节区能够与报道基因连接,该构建体加入到适当的宿主细胞中。如此处所用的术语“报道基因”是指一种基因,其编码一种能够被鉴定的基因产物(即报道蛋白)。报道基因包括但不限于碱性磷酸酶、氯霉素乙酰转移酶、β-半乳糖苷酶、萤光素酶和绿色荧光蛋白(GFP)。报道基因产物的鉴定方法包括但不限于酶测定和荧光测定。用来检测产物的报道基因和测定法在本领域公知,例如Ausubel等人(1987)和定期更新所述。报道基因、报道基因测定和试剂盒也可以从商业来源获得。合适的细胞的例子包括但不限于:植物、真菌、酵母、哺乳动物和其它真核细胞。本领域技术人员应当知道转染真核细胞的技术,包括制备合适的载体,如病毒载体;将载体导入细胞内,例如通过电穿孔;选择已经转化的细胞,例如使用报道或药物敏感性成分。根据报道基因产物的活性评价一种试剂对这些构建体中调节区转录的影响。
除了在上述通常抑制的条件下表达增强之外,当通常表达时表达可能减少。一种试剂通过降低转录速度可能实现这一点,上述报道基因系统将是一种测定方法。评价这些试剂的宿主细胞需要获准进行表达。
能够利用(从目的多核苷酸)转录mRNA的细胞鉴定特异性调节mRNA的半衰期和/或mRNA翻译的试剂。也将利用这些细胞评价一种试剂对多肽加工和/或翻译后修饰的影响。一种试剂能够通过修饰多肽的更新(turn-over)(即延长或缩短半衰期)调节细胞中多肽的含量。通过在该试剂存在下检测产物以及检测无关mRNA和多肽的产物,检测该试剂对mRNA和多肽的特异性。本领域技术人员公知检测mRNA半衰期、蛋白质加工和蛋白质更新的方法。
体内筛选方法也能够用于鉴定通过直接与多肽相互作用调节多肽功能的试剂。这些试剂能够阻断正常的多肽-配体相互作用,或者能够增强或稳定这种相互作用。这些试剂也能够改变该多肽的构象。该试剂的作用能够用免疫沉淀反应测定。将利用合适的抗体沉淀该多肽和与它紧密结合的任何蛋白质。通过比较从处理的细胞和未处理的细胞中免疫沉淀的多肽,能够鉴定一种增强或抑制多肽-配体相互作用的试剂。多肽-配体相互作用也能够用可将多肽之间紧密但是非共价的相互作用转化为共价相互作用的交联试剂评价。本领域技术人员公知检测蛋白质-蛋白质相互作用的技术。本领域技术人员也公知评价蛋白质构象的技术。
也应当理解,筛选方法可包括体外方法,如无细胞转录或翻译系统。在这些系统中,可发生转录或翻译,并检测一种试剂调节功能的能力。对于测定一种试剂是否调节mRNA或多核苷酸转录的测定法,可以使用体外转录/翻译系统。这些系统可以购得,提供了生产对应于目的多核苷酸序列的mRNA的一种体外方法。在制备mRNA后,它可以体外翻译,并比较翻译产物。不含任何试剂的体外表达系统(阴性对照)与含有一种试剂的体外表达系统之间翻译产物的比较表明该试剂是否影响翻译。对照与待测多核苷酸之间翻译产物的比较表明该试剂如果在此水平上起作用,是否选择性影响翻译(不同于以普通、非选择性或非特异性方式影响翻译)。多肽功能的调节能够用多种方法实现,包括但不限于上述体内和体外测定以及使用蛋白质制品的体外测定。能够从自然或重组来源中提取和/或纯化多肽,产生蛋白质制品。能够向蛋白质制品样品中加入一种试剂,监测其影响;即该试剂是否以及如何作用于多肽并影响其构象、折叠(或其它物理特性)、与其它部分(如配体)的结合、活性(或其它功能特征)和/或蛋白质结构或功能的其它方面,被认为具有调节的多肽功能。
在测定一种试剂的一个实施例中,其中该试剂可与通过此处所述方法鉴定的多核苷酸编码的多肽结合,首先在原核或真核表达系统中重组表达一种多肽为天然或融合蛋白,其中(如上所述鉴定的多核苷酸编码的)多肽与良好表征的表位或蛋白质偶联。然后,例如通过使用抗体或抗表位抗体的免疫沉淀,或者通过与固定的偶联物的配体结合,纯化重组多肽。然后利用由多肽或融合蛋白制成的亲和柱筛选适当标记的化合物的混合物。合适的标记物包括但不限于荧光染料、放射性同位素、酶和化学发光化合物。使用本领域技术人员常规使用的条件(例如高盐、去污剂)通过洗涤能够分离未结合的和结合的化合物。使用只含偶联物或表位的亲和柱,通过预先清除化合物混合物,能够使与亲和柱的非特异性结合达到最小。能够利用类似的方法筛选竞争结合多肽的试剂。除了亲和层析之外,还有其它技术,如测定解链温度的变化或在结合另一种分子后改变的蛋白质的荧光各向异性。例如,为了测定不同试剂的结合活性,可以使用与多肽共价偶联的传感器芯片(由Pharmacia Biosensor提供,Stitt等人(1995)Cell 80:661-670)进行BIAcore测定。
也应当理解,本发明的体外筛选方法包括结构或原理的药物设计,其中一种多肽的氨基酸序列、三维原子结构或其它性质为设计预期与多肽结合的试剂提供了基础。上下文中试剂的设计和/或选择通常由几个参数支配,如驯化生物和同源祖先多肽的并列比较、了解的多肽靶标的功能、三维结构(已知的或推测的)和原理药物设计的其它方面。也能够利用组合化学的技术产生大量候选试剂。
本发明的筛选方法也涉及本领域公知的转基因动物和植物系统。
上述筛选方法代表主要的筛选,用来检测可显示调节多核苷酸或多肽功能的活性的任何试剂。技术人员应当理解,为了进一步评价一种试剂,第二次检测可能是必要的。例如,第二次筛选可包括在使用本领域公知的小鼠和其它动物模型(如大鼠)的试验中,或在驯化或祖先植物或动物本身中,检测该试剂。另外,将进行一种细胞毒性测定,进一步证实在初次筛选中检测为阳性的试剂适用于活生物。任何细胞毒性测定均适用于该目的,包括,例如MTT测定(Promega)。
在本说明书中前面详述的筛选方法可以具体地用于EG307或EG1117。因此,本发明提供一种方法,用于鉴定可调节EG307或EG1117多核苷酸的非多肽编码区的功能的试剂,该方法包括使一种宿主细胞接触至少一种候选试剂,该细胞用一种构建体转染,该构建体含有与报道基因编码区有效连接的非多肽编码区,其中根据调节该报道多核苷酸转录或翻译的能力鉴定该试剂。本发明也提供利用该方法鉴定的试剂。
本发明也提供一种方法,用于鉴定可调节进化上显著的EG307或EG1117多核苷酸的非多肽编码区的功能的试剂,该方法包括使含有EG307或EG1117多核苷酸的植物或转基因植物接触至少一种候选试剂,其中根据调节该报道多核苷酸转录或翻译的能力鉴定该试剂。本发明也提供利用该方法鉴定的试剂。
本发明也提供一种方法,用于鉴定可调节产量的试剂,该方法包括使至少一种候选试剂接触含有EG307或EG1117基因的植物或细胞,其中根据调节产量的能力鉴定该试剂。在一个实施方案中,该植物或细胞用编码EG307或EG1117基因的多核苷酸转染。本发明也提供利用该方法鉴定的试剂。在一个实施方案中,鉴定的试剂通过调节编码该多肽的多核苷酸的功能调节产量。在另一个实施方案中,鉴定的试剂通过调节多肽的功能调节产量。
本发明也包括用此处所述的筛选方法鉴定的试剂。
下列实施例用来进一步帮助本领域技术人员。这些实施例旨在说明,因此不应被视为限制本发明。本申请中描述了大量典型修饰和变化,本领域技术人员应当理解。这些变化属于此处所述并要求保护的本发明的范围内。
实施例
实施例1:cDNA文库的构建
一种驯化植物或动物的cDNA文库用来自该植物或动物的一种合适的组织构建。本领域技术人员应当知道根据目的性状分析的适当组织。此外,也可以使用整个生物。例如,已知1天的植物幼苗表达大多数植物基因。
从组织中提取总RNA(RNeasy试剂盒,Quiagen;RNAse-freeRapid Total RNA试剂盒,5 Prime--3 Prime,Inc.,或任何类似的和合适的产物),根据常规分子克隆方法测定RNA的完整性和纯度。分离Poly A+RNA(Mini-Oligo(dT)Cellulose Spin Columns,5 Prime--3Prime,Inc.,或任何类似的和合适的产物)作为模板,用oligo(dT)为引物,进行cDNA的反转录。利用可以购得的试剂盒处理并修饰合成的cDNA,以进行克隆。然后将重组子包装于宿主细胞系中繁殖。扩增一部分包装混合物,其余部分在扩增前保留。文库可以标准化,测定文库中独立重组子的数量。
实施例2:序列比较
从cDNA文库中随机选择的祖先cDNA克隆用自动测序仪测序,如ABI377或MegaBACE1000或任何类似的及合适的产品。利用克隆载体常用的引物,如M13通用引物和反向引物进行测序。对于通过末端测序不能完全测序的插入片段,能够利用染料标记的终止子或定制引物填充剩余的缺口。
最初检查检测到的序列差异的精确性,方法是例如:发现驯化序列与祖先序列之间的差异;核对序列荧光谱(色谱),确定似乎是驯化生物特有的碱基是否对应于所述碱基特异的强烈、清晰信号;核对驯化生物的命中,发现是否有一条以上的序列对应于序列改变;以及必要时本领域公知的其它方法。同一基因的多个驯化生物序列在一个位点处含有相同的核苷酸,而在祖先的该位点处含有一个不同的核苷酸,这独立地支持该驯化序列是准确的,驯化/祖先差异是真实的。这些改变用公开或商品数据库信息和遗传密码检查,决定这些DNA序列的改变是否导致编码蛋白质的氨基酸序列的改变。也能够通过编码蛋白质的直接测序检查这些序列。
实施例3:分子进化分析
所比较的驯化植物或动物和野生祖先序列进行KA/KS分析。在此分析中,可公开或商业获得的计算机程序,如Li93和INA,用来测定如上所述研究的每个序列中,每个位点的非同义改变的数量(KA)除以每个位点的同义改变的数量(KS)。能够使用全长编码区或编码区的部分片段。KA/KS比越高,序列经历适应进化的可能性越大。KA/KS值的统计学显著性用已经建立的统计学方法和可以利用的程序如t-检验测定。
为了进一步支持高KA/KS比的重要性,所研究的驯化序列能够与其它进化上接近的种相比较。这些比较允许进一步辨别,与其它紧密相关的种相比,适应进化改变是否是驯化植物或动物谱系独特的。这些序列也能够如下检测:直接测序来自几个不同驯化群体的代表的目的基因,评价该序列在驯化植物或动物中保守到何种程度。
实施例4:cDNA文库的构建
玉米草cDNA文库用完整的玉米草1天幼苗或其它合适的植物组织构建。从幼苗组织中提取总RNA,RNA的完整性和纯度利用常规分子克隆方法测定。选择Poly A+RNA作为模板,以oligo(dT)为引物,进行cDNA反转录。为了克隆,用可以购买的试剂盒处理并修饰合成的cDNA。重组子然后包装于宿主细胞系中繁殖。扩增部分包装混合物,其余的在扩增前保留。利用建立的方法用重组DNA转染大肠杆菌宿主细胞。该文库可以标准化,并测定文库中独立重组子的数量。
实施例5:序列比较
从cDNA文库中随机选择的玉米草幼苗cDNA克隆用自动测序仪测序,如ABI377。利用克隆载体常用的引物,如M13通用引物和反向引物进行测序。对于通过末端测序不能完全测序的插入片段,利用染料标记的终止子填充剩余的缺口。
通过数据库搜索,获得的玉米草序列与驯化玉米序列相比较。对于许多种,包括玉米,基因组数据库可以公开或商品获得。玉米数据库的一个例子可在密苏里大学MaizeDB网站上发现。MaizeDB是现在知道的关于玉米基因组及其表达的公开的互联网入口。其它合适的玉米EST(表达序列标签)数据库由私人拥有和维护。获取并分析高得分“命中”,即在同源性分析后显示显著(例如>80%)相似性的序列。这两种同源序列然后用Higgins等人发展的排比程序CLUSTAL V排比。任何序列趋异,包括核苷酸置换、插入和缺失,能够通过排比检测并记录。
最初核对检测的序列差异的精确性,方法是发现玉米草与玉米序列之间存在差异的点;核对序列荧光谱(色谱),确定似乎是玉米特有的碱基是否对应于所述碱基特异的强烈、清晰信号;检对玉米的命中,发现是否有一条以上的玉米序列对应于序列改变;以及必要时本领域公知的其它方法。同一基因的多个驯化生物序列在一个位点处含有相同的核苷酸,而在祖先的该位点处含有一个不同的核苷酸,这独立地支持玉米序列是准确的,玉米草/玉米差异是真实的。这些改变用公开/商品数据库信息和遗传密码检查,决定这些DNA序列的改变是否导致编码蛋白质的氨基酸序列的改变。也能够通过编码蛋白质的直接测序检查这些序列。
实施例6:分子进化分析
所比较的玉米草和玉米序列进行KA/KS分析。在此分析中,可公开或商品获得的计算机程序,如Li93和INA,用来测定如上所述研究的每个序列中,每个位点的非同义改变的数量(KA)除以每个位点的同义改变的数量(KS)。该KA/KS比已经反映适应进化,即阳性选择的程度,在研究的序列中起作用。在这些比较分析中一般使用全长编码区。然而,也能够有效地使用编码区的部分片段。KA/KS比越高,序列经历适应进化的可能性越大。KA/KS值的统计学显著性用已经建立的统计学方法和可以利用的程序如t-检验测定。在玉米草与玉米基因之间显示统计学上高KA/KS比的基因非常可能经历适应进化。
为了进一步支持高KA/KS比的重要性,所研究的序列能够与其它祖先玉米种相比较。这些比较允许进一步辨别,与其它祖先相比,适应进化改变是否是驯化玉米谱系独特的。这些序列也能够如下检测:直接测序来自几个不同玉米群体的代表的目的基因,评价该序列在玉米种中保守到何种程度。
实施例7:KA/KS方法对于从数据库中获得的玉米和玉米草同源序列的应用
在Genbank(通过国家生物技术信息中心网站的Entrez核苷酸数据库可以获得)上可以获得的驯化玉米与玉米草序列的比较显示至少4个同源基因:waxy,A1*,A1和球蛋白,其序列可以从玉米和玉米草中获得。比较玉米和玉米草的这些基因的所有可以获得的序列。KA/KS比用Li93和/或INA测定:
    基因     平均非同义置换     平均非同义置换     KA/KS
    Waxy     4     1     0.068
    A1*     10     3     0.011
    A1     3     2     0.44-0.89
    球蛋白     10     7     0.42
尽管预计在玉米中发现的多态性(多个等位基因拷贝)和/或多倍性(每个细胞2组以上的染色体)使得KA/KS分析更加复杂或困难,但是发现这不是事实。
上述KA/KS值表明这些基因不被阳性选择,但是该实施例说明KA/KS方法能够用于从数据库中获得的玉米及其玉米草序列。
实施例8:利用转基因植物对蛋白质功能的研究
通过评价转基因玉米植物中基因的每个等位基因,能够评价根据实施例4-7的方法获得的阳性选择的玉米基因的功能作用。利用Peng等人(1999)Nature 400:256-261所述的修改的方法,能够产生转基因植物。转基因植物或其蛋白质提取物的生理学、形态学和/或生物化学检查可使每个等位基因与具体表型关联起来。
实施例9:阳性选择的基因对QTL作图
QTL(定量性状基因座)分析已经定义了含有控制几个玉米目的表型性状(包括植物高度和含油量)的基因的染色体区。通过在已知QTL之一上物理作图利用该方法鉴定的每种阳性选择的基因,能够快速、明确地鉴定每种阳性选择的基因控制的具体性状。
实施例10:新基因EG307的发现
一种标准化的cDNA文库由Oryza rufipogon的合并组织(包括叶、圆锥花序和茎)构建,已知Oryza rufipogon是现代水稻的祖先的种。首先用MegaBACE1000测序仪(AP Biotech)测序被命名为PBI0307H9的一个克隆,作为高通量测序计划的一部分。(SEQ ID NO:89)该克隆的序列在GenBank数据库的BLAST搜索中用作检索序列。命中4个无名水稻ESTs(保藏号AU093345,C29145,ISAJ0161,AU056792)。进一步测序显示PBI307H9是部分cDNA克隆。与GenBank中驯化稻的EST相比,PBI307H9具有高KA/KS比。cDNA扩增和测序如下进行:从O.rufipogon(NSGC5953株)和稻cv.Nipponbare(QiagenRNeasy Plant Mini Kit:目录号74903)中分离总RNA。利用dT引物合成第一链cDNA(AP Biotech Ready-to-Go T-Primed First-StrandKit:目录号27-9263-01),然后进行PCR分析(Qiagen HotStarTaqMaster Mix Kit:目录号203445)。
为了便于命名,克隆PBI0307H9中所含的基因在此以及全文中被命名为EG307。开始时,在最后确定序列之前,来源于现代稻的EG307和祖先水稻(O.rufipogon)EG307的KA/KS比为1.7。
一旦这些部分序列在O.rufipogon和稻中得到证实,即利用基因特异性引物进行5′RACE(Clontech SMART RACE cDNA扩增试剂盒:目录号K1811-1),获得该基因的5′端。完整基因,被命名为EG307,含有一个长1344bp的编码区。稻和O.rufipogon中完整EG307CDS(1344bp)的最终确证允许两两比较大量O.rufipogon和稻株。许多这样的比较产生大于1的KA/KS比,有些具有统计学显著性。这明显证实了阳性选择对EG307基因的作用。当施加于祖先水稻的选择压力是人为的时,这明显证实EG307是在水稻的人类驯化中选择的基因。通过BLAST搜索GenBank的非多余部分,没有鉴定到EG307的同源物,如上所述,通过在GenBank的EST部分BLAST,只鉴定了4个水稻基因(AU093345、AU056792、C29145和ISA0161)。所有4个EST基本上都未表征。
实施例11:EG307的进一步KA/KS分析
为了确定稻中存在的EG307基因的遗传多样性程度,利用Qiagen方案(DNeasy Plant Mini Kit:目录号69103),从几个不同的稻株(获自国家小谷粒保藏中心(National Small Grains Collection),U.S.D.A.,Aberdeen,Idaho)中分离基因组DNA。然后在来自下列6个不同稻株的基因组DNA中对EG307测序:Nipponbare,Lemont,IR64,Teqing,Azucena,和Kasalath。与O.rufipogon相比,每个这样的株的KA/KS比均不同。表1显示编码区的全部1344个碱基的结果。
表1:检查的O.rufipogon(IRGC105491株)与所有稻株的全部CDS KA/KS比。
Ka Ks Ka/Ks 大小bp   CDS中的位置(bp) t
  AzucenaLemontNipponbareKasalath-1Kasalath-2Kasalath-3Kasalath-4IR64Teqing  0.006680.006680.006680.002040.002930.001150.002040.002040.000  0.009220.009220.009220.004830.004820.004830.004820.007000.000   0.7240.7240.7240.4220.6080.2380.4230.291DIV/0   134113411341134113411341134113411341   1-13411-13411-13411-13411-13411-13411-13411-13411-1341   0.3980.3980.3980.5520.3690.7400.5510.902DIV/0
在O.rufipogon与所有这些稻株之间非翻译(UTR)区存在差异。由于稻株之间不同程度的杂交培育,预期有宽范围的KA/KS比。由于O.rufipogon与驯化株之间的杂交培育,有些比其它的更类似于O.rufipogon。为了O.rufipogon EG307蛋白质编码区与每个稻株的蛋白质编码区之间的所有两两比较能够测序,进行滑动窗口分析。这允许鉴定在驯化过程中选择的蛋白质的具体区域。这种准确定位使一种靶向方法能够表征祖先蛋白质与驯化后代作物的蛋白质之间重要的改变。这可允许发展针对蛋白质的这些重要结构域的试剂,旨在提高产量。
“窗口”的长度在大多数情况下为150bp,有50bp与相邻的窗口重叠。(因此,一个例子是,如果从CDS的5’端开始阅读,第一个窗口长度为150bp,相邻的第二个窗口位于其3’侧。第二个窗口的长度也是150,在第二个窗口的5’端与第一个窗口重叠50bp,第三个窗口也是150bp,在第三个窗口的5’端与第二个窗口重叠50bp。因此,第二个窗口与相邻的邻居各重叠50bp。)另外,进行第二个窗口分析,其中CDS大致分成两半。这允许更大的核苷酸样品大小,因此能够进行精确的统计学采样。应当指出,尽管KA/KS常规表示为一个比值,但是实际上是一种方法,用来询问“Ka值超过Ks值统计学显著的数量了吗?”。因此,当Ks=0时,如同在祖先水稻-现代水稻比较中通常发生的(因为只有大约7000-8000年的驯化历史),由于分数的分母等于0,所以无法计算比值。然而,如果(Ka-Ks)差是统计学显著的,这些比较仍可检测阳性选择的作用。因此,对于下表中显示的几个比较,能够检测阳性选择,只要这种比较是统计学显著的。如同Ka/Ks比是显著的那些比较一样,它们以粗体显示。
应当指出,由于核苷酸置换方法的随机性,不是所有与现代水稻株的比较都预期显示阳性选择的证据,特别是由于已知发生O.rufipogon与现代稻之间的杂交培育。
表2:O.rufipogon(NSGC5948株)与稻“Nipponbare”株的滑动窗口Ka/Ks比。注意所有统计学显著的比较都以粗体显示。
Ka Ks Ka/Ks 大小bp     CDS中的位置(bp) t
  窗口#1窗口#2窗口#3窗口#4窗口#5窗口#6窗口#7窗口#8窗口#9窗口#10窗口#11第一个大窗口第二个大窗口80%CDS几乎全部CDS   0.0000.007900.0000.0000.02030.01060.00830.01830.0000.009900.008470.007910.007880.007890.00684   0.01780.0000.0000.0000.0000.0000.0000.0000.0000.022310.032360.0000.01080.005400.00701   0.000DIV/0DIV/0DIV/0DIV/0DIV/0DIV/0DIV/0DIV/00.4440.262DIV/00.7281.460.976     16515015015015015015015015015018654354310861251     91-255256-405355-504454-603556-705655-804754-903856-1005955-11041054-12031156-1341256-798799-1341256-134191-1341     0.9650.999DIV/0DIV/01.400.9940.9991.40DIV/00.4930.9421.720.3260.4950.0343
在此重要地指出,当使用第一个大窗口时,有统计学证据支持O.rufipogon与Nipponbare比较中显示的阳性选择。这是祖先O.rufipogon与驯化稻(Nipponbare株)EG307同源物之间发生阳性选择(由于人类驯化)的良好证据。如上所述,由于核苷酸置换方法的随机性,不是与现代水稻株的所有比较都预期显示阳性选择的证据。另外,如上所述,O.rufipogon与某些驯化株之间发生杂交培育,进一步模糊了选择信号。然而,该分析解释的是EG307基因上发生了阳性选择。
表3:O.rufipogon NSGC5948株与稻(“Lemont”株)的滑动窗口Ka/Ks比。注意所有统计学显著的比较都以粗体显示。
Ka Ks Ka/Ks 大小bp  CDS中的位置(bp) t
    窗口#1窗口#2窗口#3窗口#4窗口#5窗口#6窗口#7窗口#8窗口#9窗口#10窗口#11第一个大窗口第二个大窗口80%CDS几乎全部CDS   0.0000.007900.0000.0000.02030.01060.00830.01830.0000.009900.008470.007910.007880.007890.00684   0.01780.0000.0000.0000.0000.0000.0000.0000.0000.022310.032360.0000.01080.005400.00701   0.000DIV/0DIV/0DIV/0DIV/0DIV/0DIV/0DIV/0DIV/00.4440.262DIV/00.7281.460.976     16515015015015015015015015015018654354310861251  91-255256-405355-504454-603556-705655-804754-903856-1005955-11041054-12031156-1341256-798799-1341256-134191-1341     0.9650.999DIV/0DIV/01.400.9940.9991.40DIV/00.4930.9421.720.3260.4950.0343
在此重要地指出,当使用第一个大窗口时,有统计学证据支持O.rufipogon与Lemont比较中显示的阳性选择。这是祖先O.rufipogon与驯化稻(Lemont株)EG307同源物之间发生阳性选择(由于人类驯化)的良好证据。如上所述,由于核苷酸置换方法的随机性,不是与现代水稻株的所有比较都预期显示阳性选择的证据。另外,如上所述,O.rufipogon与某些驯化株之间发生杂交培育,进一步模糊了选择信号。然而,该分析解释的是EG307基因上发生了阳性选择。
表4:O.rufipogon NSGC5948株与稻(“IR64”株)的滑动窗口Ka/Ks比。注意所有统计学显著的比较都以粗体显示。
                                CDS中的Ka     Ks     Ka/Ks    大小bp  位置(bp)   t
  窗口#1窗口#2窗口#3窗口#4窗口#5窗口#6窗口#7窗口#8窗口#9窗口#10窗口#11第一个大窗口第二个大窗口80%CDS几乎全部CDS  0.000  0.000  DIV/0    165     91-255     DIV/00.000  0.000  DIV/0    150     256-405    DIV/00.000  0.000  DIV/0    150     355-504    DIV/00.000  0.000  DIV/0    150     454-603    DIV/00.000  0.000  DIV/0    150     556-705    DIV/00.000  0.000  DIV/0    150     655-804    DIV/00.000  0.000  DIV/0    150     754-903    DIV/00.000  0.000  DIV/0    150     856-1005   DIV/00.000  0.000  DIV/0    150     955-1104   DIV/00.000  0.000  DIV/0    150     1054-1203  DIV/00.000  0.000  DIV/0    186     1156-1341  DIV/00.000  0.000  DIV/0    543     256-798    DIV/00.000  0.000  DIV/0    543     799-1341   DIV/00.000  0.000  DIV/0    1086    256-1341   DIV/00.000  0.000  DIV/0    1251    91-1341    DIV/0
注意来自O.rufipogon与稻IR64株的EG307的蛋白质编码区序列相同,因此,Ka/Ks值等于0。IR64是一种低产量现代株(个人通信,Shannon Pinson,Research Geneticist,USA-ARS Rice Research Unit,Beaumont,TX),可能与野生O.rufipogon大量杂种繁殖。
表5:O.rufipogon NSGC5948株与稻(“Teqing”株)的滑动窗口Ka/Ks比。注意所有统计学显著的比较都以粗体显示。
                               CDS中的Ka      Ks      Ka/Ks  大小bp 位置(bp)   t
  窗口#1窗口#2窗口#3窗口#4窗口#5窗口#6窗口#7窗口#8窗口#9窗口#10窗口#11第一个大窗口第二个大窗口80%CDS几乎全部CDS  0.00985 0.000   DIV/0  165    91-255     0.9950.000   0.000   DIV/0  150    256-405    DIV/00.000   0.000   DIV/0  150    355-504    DIV/00.000   0.000   DIV/0  150    454-603    DIV/00.000   0.000   DIV/0  150    556-705    DIV/00.000   0.0343  0.000  150    655-804    0.9870.00826 0.000   DIV/0  150    754-903    0.9990.00806 0.000   DIV/0  150    856-1005   0.9990.000   0.000   DIV/0  150    955-1104   DIV/00.000   0.000   DIV/0  150    1054-1203  DIV/00.000   0.0155  0.000  186    1156-1341  0.9800.000   0.0113  0.000  543    256-798    0.9960.00218 0.00536 0.407  543    799-1341   0.5470.0011  0.00854 0.129  1086   256-1341   1.140.00218 0.00767 0.284  1251   91-1341    0.909
注意来自O.rufipogon与稻Teqing株的EG307序列的比较没有显示Ka/Ks比大于1。然而,如上所述,由于核苷酸置换方法的随机性,不是与现代水稻株的所有比较都预期显示阳性选择的证据。另外,如上所述,O.rufipogon与某些驯化株之间发生杂交培育,进一步模糊了选择信号。
表6:O.rufipogon NSGC5948株与稻(“Azucena”株)的滑动窗口Ka/Ks比。注意所有统计学显著的比较都以粗体显示。
                                 CDS中的Ka      Ks      Ka/Ks    大小bp 位置(bp)   t
  窗口#1窗口#2窗口#3窗口#4窗口#5窗口#6窗口#7窗口#8窗口#9窗口#10窗口#11第一个大窗口第二个大窗口80%CDS几乎全部CDS  0.000   0.0178  0.000    165    91-255     0.9650.00790 0.000   DIV/0    150    256-405    0.9990.000   0.000   DIV/0    150    355-504    DIV/00.000   0.000   DIV/0    150    454-603    DIV/00.0203  0.000   DIV/0    150    556-705    1.400.0106  0.000   DIV/0    150    655-804    0.9940.0083  0.000   DIV/0    150    754-903    0.9990.0183  0.000   DIV/0    150    856-1005   1.400.000   0.000   DIV/0    150    955-1104   DIV/00.00990 0.02231 0.444    150    1054-1203  0.4930.00847 0.03236 0.262    186    1156-1341  0.9420.00791 0.000   DIV/0   543    256-798    1.720.00788 0.0108  0.728    543    799-1341   0.3260.00789 0.00540 1.46     1086   256-1341   0.4950.00684 0.00701 0.976    1251   91-1341    0.0343
在此重要地指出,当使用第一个大窗口时,有统计学证据支持O.rufipogon与Azucena比较中显示的阳性选择。这是祖先O.rufipogon与驯化稻(Azucena株)EG307同源物之间发生阳性选择(由于人类驯化)的良好证据。如上所述,由于核苷酸置换方法的随机性,不是与现代水稻株的所有比较都预期显示阳性选择的证据。另外,如上所述,O.rufipogon与某些驯化株之间发生杂交培育,进一步模糊了选择信号。然而,该分析再一次解释的是EG307基因上发生了阳性选择。
表7:O.rufipogon NSGC5948株与稻(“Kasalath 4”株)的滑动窗口Ka/Ks比。注意所有统计学显著的比较都以粗体显示。
                               CDS中的Ka      Ks      Ka/Ks  大小bp 位置(bp)    t
 窗口#1窗口#2窗口#3窗口#4窗口#5窗口#6窗口#7窗口#8窗口#9窗口#10第一个半窗口第二个半窗口完全CDS:Kasalath 1完全CDS:Kasalath 2完全CDS:Kasalath 3完全CDS:Kasalath 4  0.000   0.000   DIV/0  150    1-150       DIV/00.000   0.000   DIV/0  150    100-249     DIV/00.000   0.000   DIV/0  150    199-348     DIV/00.000   0.000   DIV/0  150    301-450     DIV/00.000   0.000   DIV/0  150    400-549     DIV/00.00826 0.000   DIV/0  150    499-645     0.9990.0163  0.000   DIV/0  150    601-750     1.410.00790 0.000   DIV/0  150    700-849     0.9990.000   0.000   DIV/0  150    799-948     DIV/00.000   0.0155  0.000  186    901-1086    0.9800.000   0.000   DIV/0  543    1-543       DIV/00.00437 0.00534 0.818  543    544-1086    0.1570.000   0.00268 0.000  1086   1-1086      0.9960.00110 0.00268 0.410  1086   1-1086      0.5440.00110 0.00268 0.410  1086   1-1086      0.5440.00220 0.00268 0.821  1086   1-1086      0.154
注意只显示了Kasalath 4的滑动窗口。该序列中有4个等位基因差异(被称为Kasalath 1、2、3、4),它们只有一个核苷酸不同,为了清楚起见,我们选择只显示一个。但是显示了全部CDS序列的Ka/Ks比。注意来自O.rufipogon与稻Kasalath株的EG307序列之间的比较不显示Ka/Ks大于1。然而,如上所述,由于核苷酸置换方法的随机性,不是与现代水稻株的所有比较都预期显示阳性选择的证据。另外,如上所述,O.rufipogon与某些驯化株之间发生杂交培育,进一步模糊了选择信号。
在完成了O.rufipogon NSGC5953株中EG307的测序后,利用完整的序列设计扩增引物。这些引物然后在聚合酶链反应(PCR)中使用,从其它几个O.rufipogon株中扩增EG307基因,包括NSGC5948、NSGC5949和IRGC105491。然后对所有这些株测序扩增的EG307基因。
实施例12:EG307的作图
EG307然后在水稻中物理作图。Clemson大学已经制成了一个水稻Nipponbare细菌人工染色体(BAC)文库;参见Budiman,M.A.1999,“两种模式作物西红柿和水稻的深覆盖BAC文库的构建和表征,以及西红柿中染色体向jointless-2步移的启动”。博士学位论文,TexasA & M University,College Station,TX。文库克隆能够以杂交滤纸的形式从Clemson获得。
筛选中使用的两种不同的水稻BAC文库购自Clemson大学基因组学研究所(CUGI)。OSJNBa文库在CUGI由japonica水稻株(Nipponbare变种)的基因组DNA构建,平均插入大小为130kb,覆盖11个基因组相当物。这是国际水稻基因组测序计划最广泛使用的文库之一。它在pBeloBAC11的HindIII位点构建,含有36,864个克隆。OSJNBb文库也在CUGI由japonica水稻株(Nipponbare变种)的基因组DNA构建,平均插入大小为120kb,覆盖15个基因组相当物。这是国际水稻基因组测序计划最广泛使用的另外一种文库。它在pIndigoBac536的EcoRl位点构建,含有55,296个克隆。
DIG方案(BMB-Roche PCR DIG探针合成试剂盒,目录号1636090)成功标记了独特的EG307 494bp PCR产物(引物:5′-GAGTTCACAGGACAGCAGCA-3′(SEQ ID NO:87)  和5′-CAATTCTCTGAGATGCCTTGG-3′)(SEQ ID NO:88),用来筛查水稻BAC滤纸。按照DIG方案利用化学发光能够容易地检测印迹(BMB-Roche DIG发光检测试剂盒:目录号1636090)。两个不同的稻文库,OSJNBa和OSJNBb,筛查总共5个不同的滤纸,三个覆盖OSJNBb文库,两个覆盖OSJNBa文库。表8显示所有三次筛查鉴定的各个ABC:
表8:所有用EG307 494bp PCR产物筛查BAC文库鉴定的各种BAC。
    BAC     重叠群     稻染色体
    b0008J24     重叠群80     染色体3
    b0022E21     重叠群80     染色体3
    b0025P07     未作图     --
    b0029I04     未作图     --
    b0047E13     重叠群80     染色体3
    b0023J20     重叠群80     染色体3
    b0033B08     重叠群80     染色体3
    b0050N19     重叠群80     染色体3
    b0054B15     重叠群80     染色体3
    b0071C04     重叠群80     染色体3
    b0053G15     重叠群80     染色体3
    a0078K13     重叠群80     染色体3
    a0087K16     重叠群80     染色体3
    a0076M22     重叠群80     染色体3
    a0095O02     重叠群80     染色体3
本领域技术人员知道允许一种基因对一种具体重叠群或染色体物理作图的参考数据,可以在CUGI发布给滤纸组或文库购买者的网页上获得。与重叠群113也有几个模糊、不显著的杂交,也在染色体上。
水稻重叠群80位于染色体3上,含有66个BAC和7个标记。根据重叠群80内所有这些BAC的重叠判断,EG307位于染色体3短臂上标记CDO1387的大约200kb上游。
以前在RiceGenes中的数据,由USDA-ARS发展并产生的可公开获得的基因组数据库,现在整合到Gramene中。Gramene最近受USDA IFAFS计划资助,产生一个医药(curated)、开放资源的、可以网络获得的数据资源,用于草的比较基因组分析。它提供来自Cornell大学、日本水稻基因组研究计划(JRGP)和韩国水稻基因组研究计划(KRGRP)的大量水稻遗传图谱,以及与来自其它草(玉米、燕麦和小麦)的图谱相比较。利用RiceGenes网站,CDO1387标记对几个不同的水稻图谱作图。
也存在对该区域作图的几个QTL,但是它们中的许多具有几乎覆盖整个染色体的更宽的范围。1000粒重的一个得到证明的QTL对染色体3的该区域作图,与标记RZ672有关(S.R.McCouch等人Genetics150:899-909 Oct 98)。在一张图(R3)上,CDO1387对30.4cM作图,RZ672对39cM作图,这两种标记都在相似的范围内对其它4种水稻图谱(水稻-CU-3、3RC94、3RC00和3RW99)作图(图5)。因此,EG307位于该QTL标记的~10cM之内。R3图谱也含有一个BAC,OSJNBaO091P11,对21.45cM-21.95cM作图。在筛查水稻ABC文库后,对于该BAC和同一重叠群中的其它任何BAC,EG307是阴性的。水稻的粒重QTL区也与水稻与玉米之间的某些同线性研究有关,表明水稻染色体3S与玉米染色体1S和9L之间的同线性(W.A.Wilson等人Genetics 153(1):453-473 Sep 99)。
实施例13:玉米和玉米草中EG307的鉴定
通过BLAST(使用水稻EG307序列)在GenBank中搜索玉米基因组鉴定了两个玉米EST,保藏号为BE511288和BG320985,它们似乎是同源的。设计引物,以便成功扩增玉米(Zea mays)和玉米草(Zeamays parviglumis)EG307同源物(SEQ ID NO:33和SEQ ID NO:34,含有一个建议的由SEQ ID NO:35表示的开放阅读框,和SEQ IDNO:66,含有一个建议的由SEQ ID NO:67表示的开放阅读框)。(推断玉米和玉米草的蛋白质序列;由SEQ ID NO:36和SEQ ID NO:68表示)。表9显示玉米与玉米草相比较的Ka/Ks估计。
表9:玉米草(Zea mays parviglumis)与现代玉米(Zea mays)的Ka/Ks比。
玉米(BS7)  Ka  Ks  Ka/Ks  大小bp   CDS中的位点(bp)    t
玉米草(Benz967)  0.00970  0.0210  0.462  1347   1-1347    1.16
尽管这些Ka/Ks值不显示比值大于1,但是仍然证明了阳性选择。表征了祖先水稻与其现代驯化后代之间的所有氨基酸置换,并对玉米草及其后代,现代玉米,进行了相同的分析。在两种(独立的)驯化情况下,观察到一致的模式:与祖先植物(玉米草或祖先水稻)相比,现代作物(玉米或水稻)中几乎所有的氨基酸置换均导致电荷/极性增加,溶解度提高,疏水性降低。这种模式最不可能在这两个独立驯化事件中偶然发生。这提示,这些置换对人类造成的驯化有相似的反应。这有力地证明,由于人类对这两种谷类的驯化,EG307已经选择。
在完成一个玉米草株的EG307测序后,利用完成的序列设计扩增引物。这些引物然后在聚合酶链反应(PCR)中使用,从其它几个玉米草株以及几个现代玉米株中扩增EG307基因。然后对所有这些株的扩增的EG307基因进行测序。
尽管为了清楚和理解起见,已经通过图示和实施例详细描述了本发明,但是本领域技术人员应当理解,能够进行某些改变和修饰。因此,这些描述和实施例不应被视为限制附加权利要求书所述的本发明的范围。
实施例14:新基因EG1117的发现和KAKS分析
在EG高通量测序计划中,首先用MegaBACE1000测序仪(APBiotech)测序克隆IWF1117H5(下文称为EG1117)。该克隆从标准化的cDNA文库(Incyte Genomics)测序,该文库由来自祖先水稻Oryzarufipogon的材料构建。GenBank BLAST结果命中三个无名水稻ESTs(AU055884,AU055885,BI808367),两个无名玉米ESTs(AI783000,AW000223),和两个无名小麦ESTs(BE444456,BE443845)。进一步的测序显示,IWF1117H5是一个部分cDNA克隆。与GenBank中驯化水稻(Oryza sativa)的ESTs相比较时,Ka/Ks比除以0。
按照Qiagen的方案(DNeasy Plant Mini Kit:目录号69103),从稻的几个不同的栽培种中分离基因组DNA。从O.rufipogon和稻cv.Nipponbare中分离总RNA(Qiagen RNeasy Plant Mini Kit:目录号74903)。使用dT引物合成第一链cDNA(AP Biotech Ready-To-GoT-Primed First-Strand Kit:目录号27-9263-01),然后进行PCR分析(Qiagen HotStarTaq Master Mix Kit:目录号203445)。也对玉蜀黍(玉米)、Zea mays parviglumis(玉米草)和Triticum aestivum(现代小麦)进行这些方案。
一旦这些部分序列在O.rufipogon和稻中得到证实,即用基因特异性引物进行反向PCR,试图获得该基因的5′端。迄今为止,O.rufipogon和稻中的1659bp CDS(图6和7)已经鉴定。这个部分序列包含终止密码子。
EG1117然后在来自以下6种不同稻株的基因组DNA中部分测序:Nipponbare,Lemont,IR64,Teqing,Azucena和Kasalath。与O.rufipogon 5948株相比,所有这些株的Ka/Ks比都不同。编码区1656个碱基的Ka/Ks比如下:
表10:O.rufipogon NSGC 5948株与不同稻株的Ka/Ks比
           株    Ka/Ks     t
Nipponbare:O.rufipogon     1.5     0.37
Lemont:O.rufipogon     1.5     0.37
Azucena:O.rufipogon     1.5     0.37
IR64:O.rufipogon     0.0     1.0
Teqing:O.rufipogon     0.0     1.0
Kasalath:O.rufipogon     0.0     1.4
由于稻株之间杂交培育的量,预期Ka/Ks比范围较宽。由于O.rufipogon与驯化株之间的杂交培育,其中一些类似于O.rufipogon。
利用推断的稻Nipponbare株的蛋白质序列进行BLAST搜索。极强的蛋白质BLAST命中拟南芥PTR2-B(组氨酸转运蛋白,NP_178313)(SEQ ID NO:170)提示,水稻序列只丢失CDS的约30个密码子(图8)。
同源性搜索结果提示,EG1117基因编码一种蛋白质,该蛋白质与包括真菌、植物、昆虫和哺乳动物在内的广泛的种中发现的肽转运蛋白家族非常相似。(参见Koh等人(2002)Arabidopsis.Plant Physiol.128:21-29;Hauser等人(2001)Mol.Membr.Biol.18:105-12;Hauser等人(2000)J.Biol.Chem.275:3037-42;Lubkowitz等人(1997)Microbiology 143-387-96;Steiner等人(1995)Mol.Microbiol16:825-34)。EG1117编码一种577个氨基酸的蛋白质,该蛋白质似乎有12个推断的跨膜域区。EG1117的KA/KS分析提示,在水稻驯化过程中EG1117基因的至少一部分被强烈选择。
显然这种具体蛋白质是独特的,尽管它显示与大量良好表征的肽转运蛋白有明显的结构同源性(Steiner等人(1995))。该序列似乎编码预测的该蛋白质家族特有的12个跨膜域。EG1117蛋白显然不仅与肽转运蛋白同源,而且与寡肽转运蛋白和硝酸盐转运蛋白同源(Lubkowitz等人(1997);Lin等人(2000)Plant Physiol.122:379-88;West等人(1998)Plant J.15:221229)。与其它类型的转运蛋白没有同源性。
肽转运蛋白是整合膜蛋白,在二肽/三肽转运蛋白中一般含有12个跨膜域,在寡肽转运蛋白中可含有12-14个跨膜域。肽转运蛋白质家族(PTR家族)已经在酵母和植物中广泛研究。这些蛋白质一般有助于二肽/三肽或寡肽以质子依赖的方式穿过细胞膜转运。这些载体偶联穿膜肽运动与内部定向电化学梯度的质子运动,使得肽的转运与底物梯度相反地发生(Nakazono等人(1996)Curr.Genet.29:412-16;Matsukura等人(2000)Plant Physiol.124:85-93;Toyofuku等人,(2000)PlantCell Physiol.41:940-47;Hirose等人(1997)Plant Cell Physiol.38:1389-1396;Horie等人(2001)Plant J.27:129-38)。肽转运蛋白一般进行所有可能的二肽和三肽的序列独立的转运。含有氨基酸的L-对映异构体的肽全部显示立体选择性,其结合亲和力高于含有D-对映异构体的肽。目前,使不同转运蛋白的结构与它们的底物特异性或亲和性相关联是不可能的。
已经鉴定了多个种的多种不同的肽转运蛋白。这些蛋白质的全面排比使得研究人员能够鉴定一般在该家族所有成员中发现的主要氨基酸序列中的基序。在肽转运蛋白家族的PTR-2成员中,已经鉴定了“FYING”基序,以第5个跨膜域(TMD5)中的保守F-Y-x-x-I-N-x-G-S-L残基和跨膜域10(TMD10)中的W-Q-I-P-Q-Y基序或E-x-C-E-R-F-x-Y-Y-G基序命名(Becket等人(2001)in PEPTIDES:THE WAVE OF THE FUTURE,M.Lebl和R.A.Houghten编著.American Peptide Society,957-58)。有趣的是,酿酒酵母中FYING基序的定点诱变导致二肽的生长减弱,对毒性二肽的敏感性降低,放射性标记的二亮氨酸消除。这些数据提示,FYING基序在底物识别和/或易位中起重要作用。
对于植物,文献中证实肽转运蛋白不仅在肽和硝酸盐的营养摄取中重要,而且这些转运蛋白影响对生长素、致病毒素和其它发育过程的反应。对于拟南芥肽转运蛋白,AtPRT2,证明含有毒性乙硫氨酸的肽影响根的生长,认为该肽由这种特定转运蛋白转运(Steiner等人(1994)Plant Cell 6:1289-99)。在后一项研究中,显示通过AtPTR2-B基因的有义或反义构建体的重组表达,AtPTR2-B蛋白的过量表达或表达的抑制导致转基因似南芥植物开花延迟和种子发育停滞(Song等人(1997)PlantPhysiol.114:927-935)。这提示肽转运蛋白可能对植物的生长和发育都有极深刻的影响。
推断的EG1117肽转运蛋白的进一步分析证实,与其它典型植物PTR-2型蛋白质相比,FYING基序实际上存在于EG1117的TMD5中。另外,EG1117在TMD10中含有一个WQVPQY基序,这与其它典型植物PTR-2型蛋白质相同。DIALIGN局部排比程序(Morgenstern(1999)Bioinformatics 15:211-218)产生的多重序列排比证实,不同PTR-2型植物蛋白质序列与水稻EG1117蛋白质几乎95%排比,在氨基酸水平上有大约70%的同源性。在稻和O.rufipogen蛋白质中,只有三个非同义氨基酸置换。这些置换是结构上重要的置换,可以显著改变推断的肽转运蛋白的功能或特异性。在一个情况中,我们将谷氨酰胺(极性不带电荷)改变为组氨酸(碱性)氨基酸。在其它两个位点,我们发现酸性天冬氨酸改变为不带电荷的甘氨酸,酸性谷氨酸改变为不带电荷的甘氨酸。所有三个改变通常向碱性更强的电荷谱转变。
实施例15:EG1117的作图
水稻EG1117然后物理作图。DIG方案(BMB-Roche PCR DIG探针合成试剂盒,目录号1636090)成功标记一种独特的EG1117 657bpPCR产物(引物:5′-TCCTGCATCCCTCTCAACTT-3′和5′-GCATTGGATTCGATGAATGT-3′),筛查来自Clemson大学的水稻BAC滤纸。最后按照DIG方案利用化学发光检测这些印迹(BMB-Roche DIG发光检测试剂盒:目录号1636090)。两个不同的稻文库(OSJNBa和OSJNBb)筛查总共2个不同的滤纸。以下是两次筛查鉴定的BAC。
表11:所有用EG1117 PCR产物筛查BAC文库鉴定的各种BAC。
    BAC     重叠群     稻染色体
    b0094D04     重叠群58     染色体3
    b0067O19     重叠群58     染色体3
    b0073E24     重叠群58     染色体3
    b0053L18     重叠群58     染色体3
    b0095H17     重叠群58     染色体3
    a0004L21     重叠群58     染色体3
    a0031E20     重叠群58     染色体3
    a0035M21     重叠群58     染色体3
    a0024M01     重叠群58     染色体3
水稻重叠群58位于染色体3上,含有181个BAC和15个标记。EG1117对与标记CDO1387、C236、C875、R2778和R2015相同的BAC作图。在图谱3RJ98上,它们均对35.8cM作图。该标记对几个不同的水稻图谱作图,通过RiceGenes或Gramene网站评价。也有几个QTL对该区域作图。1000粒重的一个得到证明的QTL在染色体3的该区域中,与标记RZ672有关(McCouch,S.R.等人Genetics150:899-909)。在一张图上,CDO1387对30.4cM作图,RZ672对39cM作图,这两种标记都在相似的范围内对其它4个水稻图谱作图。水稻的该区域也与水稻与玉米之间的某些研究有关,表明水稻染色体3S与玉米染色体1S和9L之间的同线性(Wilson,W.A.等人Genetics153(1):453-473)。
实施例16:EG307与EG1117的关系
EG1117和以前描述的基因EG307对同一Clemson BAC重叠群58作图。EG1117朝向在EG307约3cM上游的p-臂的末端。EG1117对与重叠群58上多种标记相同的BAC作图,EG307对同一重叠群作图,但是标记不对阳性BAC直接作图。
利用来自水稻基因组计划(RGP)的公开的YAC水稻图谱的数据进行不同的分析,RGP是国家农学研究所(NIAS)和农业、林业、渔业技术创新社会研究所(STAFF)的一项联合计划,和日本农业、林业、渔业省(MAFF)基因组研究计划的一部分。
RGP数据库使这两个基因(EG1117和EG307)在染色体3上分开2cM。该YAC图谱已经由Plant Cell接收准备发表(Wu,J.等人,2002Plant Cell,发表前的拷贝)。在BLAST搜索后(见上),EG1117命中AU055884和AU055885。这两个GenBank EST个体均来自克隆S20126,对YACs Y2533和Y5488作图。这些YAC用S10968锚定,在33.5cM处对染色体3作图。
这两个基因出科意料的接近提示可能的功能相关。EG307和EG1117可以一起作用,提高产量。我们推测EG307可能是EG1117的一种转录因子,因而产生一种植物操纵子。所有迹象都表明EG307和EG1117是影响农业上重要的性状的基因的合理候选物,这是根据:1)对水稻驯化和祖先种的KA/KS分析,2)与粒重QTL的关联,和3)祖先与驯化种之间氨基酸置换的一种进化模式。根据水稻中的KA/KS分析,EG1117也显示驯化过程中强阳性选择的证据。EG1117编码一种与肽转运蛋白家族同源的蛋白质。该家族的其它成员在植物中已经显示影响生长、开花和种子发育。EG1117也与粒重的QTL有关。这是巧合的可能性极小。它们是用来证实这些基因与农业相关的理想基因。
实施例17:产量候选物的验证:组合分析和谱系分析
EG307和EG1117在控制谷类产量上的作用能够通过产生转基因植物证实,如本专利其它部分所述;另一个证据支持来自于组合分析和谱系分析。
组合分析包括在大量良好表征的水稻株中测序每个候选基因,了解这些基因是否与已知的性状有关。测序13个良好表征的现代水稻株的EG307,确定在所有9个最高产量株中存在衍生的、阳性选择的等位基因,而祖先等位基因存在于4个最低产量株中。通过检查表12发现的模式非常惊人。这补充了EG307确实影响产量的证据,即它可能是所谓的“产量”基因。
表12:阳性选择的EG307等位基因分隔高产量水稻株
株名 保藏号   1000-粒重   衍生的等位基因 祖先等位基因
 AC27   PI378579   45.97   X
 KokokuMochi PI389321 40.55 X
 Razza77   PI279988   38.64   X
 Vary Voto277 PI400774 37.17 X
 Azucena   PI400077   32.08   X
 Dalila   PI388430   24.28   X
 TOTO   PI274213   23.97   X
 Sathri Sufaid   PI385876   23.95   X
 Zenith   CIor7787   23.93   X
 Ngoat   389239   9.57   X
 BR52-8-1   408373   6.89   X
 Jira Shahi   392245   9.05   X
 IR1545-339-2-2 408625 3.37 X
谱系分析利用两组重要的数据。除了可以获得的粒重数据外,许多水稻株(即在谱系中)的衍生众所周知。这产生一种验证方案,其中产量相关候选基因对已知的水稻株谱系作图。对于每个株,注意EG307和EG1117的已知的1000粒重和等位基因类型(即“衍生的”、适应的、现代等位基因)。根据这些数据能够推断适应的等位基因的传播模式。
实施例18:玉米和玉米草中EG1117的鉴定
利用实施例13描述的本领域技术人员公知的方法,从大量玉米株(Zea mays mays)SEQ ID NOs 119、122、123、124、127、128、129、132、135、136、137、140、141、144、145、146、149、150、151、154)和大量玉米草株(Zea mays parviglumis)(SEQ ID NOs 157、160、161、162、165、166、167)中扩增EG1117。
实施例19:基因候选物EG307的功能的测定
为了阐明EG307蛋白的功能,将测定与其相互作用的水稻蛋白质。这种“牵连犯罪(guilt-by-association)”方法在人们希望鉴定与未知蛋白质有关的可能的途径或功能时有用(评论(2001)Nature 410)。测定相互作用的蛋白质的两种方法包括整体筛选法,如酵母双杂交法,以及更直接的方法,利用未知蛋白质的重组表达形式根据它们相互作用的亲和力分离相互作用的蛋白质。显示了这两种方法的实验方法和设计的简述。
A.酵母双杂交(YTH)筛选。对相互作用的蛋白质的YTH筛选方法依赖于产生目的蛋白质与转录激活因子蛋白质结合域的一半(饵)的重组融合体,以及使用与转录激活因子激活域的另一半(靶蛋白)融合的可能的蛋白质编码区的cDNA文库。如果饵靶蛋白相互作用,转录因子的两半(结合域和激活域)聚集在一起,一个启动报道基因的转录。一般使用两个基本类型的YTH系统,用于标准YTH的基于GAL4的系统(Fields等人(1989)Nature 340:2445-246)和基于LexA的“相互作用-捕获”(IT)方法(Golemis等人(1997)《现代分子生物学方法》,F.M.Asubel等人编著,John Wiley & Sons,NY;Golemis等人(1997)《细胞:实验室手册》,D.L.SpSeptor,R.Goldman,和L.Leinwand编著,Cold Spring Harbor Laboratory Press)。
两个水稻YTH cDNA文库(L与Mil-Yang)可以从Eugentech,Inc.(Yusong Taejon,Korea)购买。这些文库在Stratagene HybriZAP_(基于GAL4的系统)由cDNA产生,该cDNA利用从长出长度<2cm或>2cm的穗的水稻中分离的mRNA产生。重要的是,我们从EG307表达的RT-PCR分析知道,EG307蛋白应当存在于这些组织中。因此,这些文库可能表达与EG307蛋白相互作用的蛋白质。
实验细节。HybriZAP YTH系统特定的标准试剂、酵母株、载体和DNA分离/测序从Stratagene获得。利用稻芽mRNA的RT-PCR扩增克隆EG307的编码区。PCR扩增的插入片段克隆到线性化的pBD-GAL4 Cam噬菌粒载体内,在氯霉素平板上筛选携带插入片段的转化子,产生“饵”质粒。EG307的克隆连接和编码区在EG用标准测序技术测序,确保使用适当的阅读框,并且在EG307扩增过程中没有突变引入。
来自Eugentech的两种商品文库被该公司报道为从初级文库中一轮扩增,以2×108pfu提供。文库I(<2cm穗)最初有1×106pfu的复杂性,扩增的文库滴度为3.6×108pfu/ml。文库I中的插入大小为0.5-3.0kb。文库II(>2cm穗)最初有5×105pfu的复杂性,扩增的文库滴度为4×106pfu/ml。文库II中的插入大小为0.5-1.6kb。由于这些预先制备的文库能够以极其合理的价格购到,因此需要谨慎使用这种具体系统进行最初的YTH捕获。
使用Stratagene的YRG-2酵母感受态细胞文库试剂盒,饵质粒和靶质粒文库共转染酵母株YRG-2。通过YRG-2营养缺陷型突变的互补筛选携带这两种质粒的酵母。在该情况下,饵质粒和靶质粒应当补充YRG-2株的色氨酸和亮氨酸营养缺陷型。利用通过这种共转染生长的菌落产生酵母文库,然后在缺乏组氨酸和含有X-gal的平板上进一步筛选,筛选相互作用的靶蛋白。YRG-2株携带另外两种报道质粒。一种在HIS基因上游携带GAL4结合序列,用来补充YRG-2组氨酸营养缺陷型突变。另一种质粒在LacZ报道基因上游携带GAL4结合序列。当酵母平板接种含有X-gal的平板时,这允许报道基因表达的蓝/白选择。在相互作用筛选过程中,只有含有相互作用的饵:靶组合的酵母能够补充组氨酸营养缺陷型,也导致LacZ的表达以及X-gal底物转化为蓝色产物。对相互作用的这种双筛选有助于限制鉴定的假阳性菌落的数量。另外,在某种程度上,蓝色底物产生的强度表示饵与靶蛋白之间相互作用的强度。
挑取相互作用的菌落,分离DNA,对来自几百个菌落的靶质粒的插入序列进行测序。翻译这些序列,对蛋白质序列(全长编码区和来自EST的可能的开放阅读框)搜索。当多种相同的序列被鉴定为靶标时,可能优先选择蛋白质,代表一种相互作用的蛋白质。如果一种序列只代表一次或几次,它是一种非特异相互作用的蛋白质,或在cDNA文库中代表有限次数的转录物。
多个类别的相互作用蛋白质应当这样鉴定。理想地,已知功能的蛋白质高度代表,合理的功能或途径容易地鉴定。如果相互作用的蛋白质未知,但是与已知的蛋白质同源,仍然可能根据已知的公共信息设计实验来证实相互作用的相关性。
存有疑问的蛋白质-蛋白质相互作用将用其它体外和体内研究证实。如果时间允许,将在I期进行更简单的试验证实相互作用。在制备其它试剂如抗体和重组蛋白后,进行如亲和pull-downs和far-westerns的测定。必要时产生饵蛋白(EG307)以及推断的相互作用蛋白的重组蛋白,作为表位标记的融合蛋白(GST、myc、V5、生物素标签)。有关体内相互作用的其它证据,如适当构建的两种绿色荧光融合蛋白之间的荧光能量转移,可能是最终证实体内相互作用所必需的,也是可能影响这种相互作用的确定因素。然而,这些实验显然超出了I期的范围。
YTH搜索有可能鉴定饵蛋白本身结合GAL4转录激活序列,并导致报道系统的激活。如果发生这种情况,将构建独立表达EG307蛋白的两半的两种饵构建体。检测这些构建体中YRG-2中GAL4报道基因的直接激活。如果直接激活为阴性,将对饵:靶相互作用重新筛查cDNA靶文库。
如果从预先制备的商品YTH文库中未鉴定出相互作用的蛋白质,可能是这些文库质量较差,或者GAL4 YTH系统不敏感,不足以鉴定实际的相互作用蛋白质。在任一种情况下,可以认为在相互作用-捕获系统(LexA)中构建了备选文库。这些文库然后作为进一步表征其它任何未知候选蛋白质的基础。
实施例20:利用物理方法直接分离和鉴定相互作用的蛋白质
为了从植物组织中直接分离相互作用的蛋白质,亲和分离溶解的不同植物组织中存在的蛋白质。分离的相互作用的蛋白质进行有限的蛋白水解,通过质谱分析法分析获得的肽片段,确定是产生代表已知的还是预测的蛋白质的肽片段模式。
利用Pharmacia的pGEX-5X-I(Amersham Pharmacia)将EG307蛋白克隆到细菌表达系统中,产生GST-EG307融合蛋白。用IPTG诱导表达的培养物的细菌裂解液在谷胱甘肽sepharose珠上纯化融合蛋白。使游离谷胱甘肽通过该柱,通过与固相竞争结合,从珠上洗脱可溶性蛋白质。重组GST-EG307当与新鲜谷胱甘肽sepharose珠重新偶联时,能够用作亲和配体。此外,通过用因子Xa处理融合蛋白去除GST域,也能够获得游离EG307蛋白。预测的EG307蛋白中没有因子Xa蛋白酶位点。
通过标准的差示组织破坏和澄清技术产生从大量稻幼苗(200-300克)中分离的植物细胞裂解物。为了分离细胞溶质蛋白质,在蛋白酶抑制剂混合物存在下,利用polytron组织匀浆器细胞和超声仪通过机械剪切破坏细胞,而使组织裂解物保持低温。通过低速差速离心去除碎片,随后高速离心去除不可溶的凝聚蛋白质,澄清可溶性细胞溶质裂解物。为了在不可溶级分中分离蛋白质,使用不同去污剂如NP-40、Brijg 35和去氧胆酸盐溶解从这些不可溶膜级分中分离的膜结合蛋白质。不可溶物质通过离心去除。
植物细胞裂解物分别通过谷胱甘肽-sepharose:GST-EG307珠。该珠用不同离子强度的缓冲液洗涤,除去结合较弱的蛋白质。结合的蛋白质然后用低pH、高盐或变性的去污剂洗脱。纯蛋白质在SDS-PAGE凝胶上电泳,条带用与质谱法相容的银染色试剂或考马斯蓝染色。从凝胶上切下目的条带,冷冻以备日后分析。这些蛋白质送往质谱设施进行有限蛋白水解,随后进行质谱分析,测定蛋白水解肽特征以及相互作用蛋白质的身份。
该技术允许鉴定相互作用的蛋白质,只要这种相互作用的亲和性是特异的且强到足以确保EG307蛋白与可能的相互作用蛋白质之间紧密结合。如果该蛋白质与其它蛋白质同源,这些数据然后可用于鉴定相互作用的蛋白质。由于缺乏对EG307蛋白的亲和性,显然利用该方法不可能鉴定蛋白质。此外,利用上述方法产生的裂解物中可能不含相互作用的蛋白质。
如果有太多的蛋白质似乎结合谷胱甘肽-seph:GST-EG307珠,这些蛋白质可能非特异地结合sepharose、谷胱甘肽、谷胱甘肽合成酶或通过N端GST与EG307融合产生的人工表位。为了消除一些这样的非特异性相互作用,裂解物单独用sepharose珠、用谷胱甘肽-sepharose以及与谷胱甘肽珠偶联的无关GST-融合蛋白预先清除。如果在预先清除步骤之后非特异带仍然存在,则利用更严格的洗涤和结合条件限制与该引诱蛋白结合的蛋白质,如高盐、低盐、提高或降低pH、添加非离子去污剂,如Tween-20。
实施例21:测定编码一种具有推断的肽转运功能的新型蛋白质的基因候选EG1117的功能
由于EG1117蛋白可能编码一种形式的肽转运蛋白,根据in silico同源性数据,提示它是PTR-2蛋白质家族的一个成员,进行直接评价这种具体功能的实验。使用两种互补但是独立的评价。首先,利用检查酵母中异源肽转运蛋白功能的一种方法检查EG1117的驯化和祖先形式穿过细胞膜转运肽的能力,以及补充酵母PTR-2缺失突变体中营养缺陷型氨基酸需要的能力。其次,在含有毒性乙硫氨酸的肽的存在下,利用水稻幼苗的驯化和祖先种将可能的肽转运蛋白突变与可测定的驯化与祖先水稻种之间的表型差异关联起来。
在营养缺陷型酵母中的异源肽转运功能的互补分析。在这些研究中,我们采用以前描述的用来鉴定新型拟南芥肽转运蛋白的方法,其中使用特别设计的营养缺陷型突变酵母株,它们在转运二肽/三肽的能力上也有一个突变(Steiner等人,1994)。这种异源系统证实,植物肽转运蛋白能够克隆到酵母细胞内,通过补充酵母株的营养缺陷型氨基酸需要,能够测定重组表达的蛋白质功能。这是一种简单但是有效的测定,可快速获得关于两种EG1117形式的功能的信息。
亲本酵母株BY4742[Mata,his3-,leu2-,lys2-,ura2-]和YKR093WORF缺失突变体来自可从ATCC获得的“完整酵母缺失阵列收集”,其中PTR-2基因缺失,被命名为BY4742-ptr2。这两株均可从ATCC获得。EG1117的驯化和祖先形式克隆到pYES2.1-TOPO-TA载体内(Invitrogen,Inc.),该载体可使推断的PTR-2蛋白在酵母BY4742-ptr2营养缺陷株中重组表达。转染体的筛选在缺乏尿嘧啶的平板上进行。从转染体中再分离质粒DNA,利用EG1117特异的引物分析,证实该株携带适当的质粒。蛋白质表达受培养基中半乳糖的存在控制。转染体在含有半乳糖的培养基中生长,通过western印迹分析载体添加的C端V5表位标签,监测EG1117蛋白的表达。下面显示在补充和根生长试验中使用的肽:
    正常肽     毒性肽
    Met-Leu     Eth-Leu
    Met-Leu-Gly     Eth-Leu-Gly
    Met-Leu-(Gly)2     Eth-Leu-(Gly)2
    Met-Leu-(Gly)3     Eth-Leu-(Gly)3
Eth=硫堇,是甲硫氨酸的一种有毒衍生物。所有对营养缺陷型表型的筛选都在缺乏亮氨酸的平板上进行。
为了检测EG1117是否编码一种肽转运蛋白,商业合成并纯化上述肽。由于每个肽都携带一个亮氨酸,如果将该肽转运到用一种功能肽转运蛋白转染的亮氨酸营养缺陷株BY4742-ptr2中,并在半乳糖存在下生长,该株应当能够生长。
将要进行的第二种测定是一种抑制测定。在此情况下,BY4742-ptr2 EG307转染体以及作为对照的BY4742亲本和BY4742-ptr2缺失体,作为菌苔接种到YPG(酵母提取物,蛋白胨,半乳糖)平板上,毒性乙硫氨酸-肽衍生物向膜片上印迹,并置于酵母菌苔上(Steiner等人,1994)。因此膜片周围的清洁区表示该酵母表达一种功能转运蛋白,可使该酵母将毒性肽转运到细胞内,杀死细胞。
如果EG1117蛋白的驯化和祖先形式都补充氨基酸营养缺陷型突变,提示它们都是功能转运蛋白,则进行下列实验。为了评价pH或阳离子依赖性,平板接种培养基的pH或离子强度将变化,并且测定携带EG1117蛋白的转染体在补充肽存在下生长或者在毒性肽存在下死亡的能力。同样,为了评价肽亲和力的可能的差异,评价特定肽或该肽的毒性变体对酵母转化子生长的剂量应答影响。
我们非常可能发现,EG1117蛋白实际上编码一种肽转运蛋白。这两种形式的蛋白质也可能在其功能上显示可以测量的差异,也许特异性/选择性、最适pH或亲和力的改变是明显的。尽管在酸性到更多碱性特征的氨基酸序列中存在非同义改变,这些改变可能位于该蛋白质的一个不重要的区域中。此外,这些改变也可能不改变该蛋白质的三维结构,不足以改变其功能。
这些蛋白质不太可能不转运肽,然而,EG1117蛋白可能是其它一些底物的转运蛋白。在该情况下,在没有EG1117转运肽的任何证据时,可以使用同一系统或至少转染的酵母来分类一些其它功能。例如,能够检测适当营养缺陷株中的单糖或多糖转运能力。此外,靶向转运功能的其它酵母缺失突变体也能够与现有的转染体繁殖。在该情况下,繁殖的酵母在选择平板上生长将表示该具体缺失突变互补。利用这种策略,能够扫描大量可公开获得的不同酵母缺失突变体(Brachman等人(1998)Yeast 14:115-132。
实施例22:祖先和驯化的水稻幼苗对含有乙硫氨酸的毒性肽的不同敏感性
这些研究试图直接在体内证明该EG1117蛋白在驯化的和祖先水稻株中起不同作用。转运毒性肽的能力导致摄取毒性肽的细胞死亡。功能的缺乏可能表现为对毒性肽影响幼苗根持续生长的抗性。表型差异的缺乏提示EG1117未表达,或者其它转运蛋白补偿选择的EG1117蛋白的改变的功能。
在这些研究中使用用于拟南芥的方法的一种修改方法(Steiner等人,1994)。使来自O.sativa和O.rufipogen的水稻种子发芽,然后幼苗在黑暗、潮湿的容器中在水稻培养基上继续生长。幼苗暴露于浸有含乙硫氨酸的毒性肽或非毒性肽(作为对照)的盘中。最初的实验集中在测定对毒性肽的敏感性是否存在显著差异。如果没有观察到显著差异,在一个较大规模的实验中使用一定剂量范围的毒性肽进行其它实验,来测定是否存在对毒性肽的不同敏感性。这暗示两个水稻株中存在肽转运蛋白的功能活性的差异。
这组研究的结果取决于是否有其它的肽转运机制补充假定的EG1117编码的蛋白质的差异。只要EG1117是水稻使用的主要肽转运蛋白,或者具有对于水稻植物生长至关重要的独特功能,驯化的与祖先形式之间EG1117功能的任何差异都应当表现为对毒性肽的敏感性的差异。在拟南芥中进行的类似实验成功地证明了单PTR-2蛋白是单肽转运系统的一部分(Steiner等人,1994)。因此,单肽转运蛋白的突变体产生生长抑制的显著结果。具体而言,这些研究显示,由于早期胚中PTR-2表达的发育阻断,PTR-2蛋白的缺失或PTR-2蛋白表达的缺乏导致植物对周围环境中存在毒性肽的抗性。水稻幼苗的生长可能相似,通过改变水稻幼苗的生长,能够容易地显示EG1117功能的任何差异。
                         序列表
<110>Evolutionary Genomics LLC
<120>鉴定驯化的植物和动物中进化上显著的多核苷酸和多肽序列改变的方法
<130>GENO200.1.6/PCT
<150>US60/349,088
<151>2002-01-16
<150>US60/349,661
<151>2002-01-17
<150>US60/368,541
<151>2002-03-29
<150>US10/079,042
<151>2002-02-19
<160>145
<170>PatentIn version 3.2
<210>1
<211>2441
<212>DNA
<213>Oryza sativa cv.Azucena
<400>1
ccatgtcgag gtgcttcccc tacccgccgc cggggtacgt gcgaaaccca gtggtggccg     60
tggccgcggc cgaagcgcag gcgaccacta aggtttgttg aaccatcgga tttacacacg    120
cacgtgccgg atcatttgct cttgcctgtt ggttttgatc ggatctgttg gttgtgcgtg    180
tgtgatttgg ggatcgcacg tgcggggaag ctaacctttg catggataac ttgagatttg    240
tgaggccgcg cttcgaccag atcggtcgcc aatcttttag tggctgaccg tggaaagagg    300
atattactga ccttcggttt gctaattttg gttgtgccgt tgaatctgaa ataaccagaa    360
tagtcatggg gaaaaaagtc tgatctggaa ggttcgaatt acatttctat atattgttgt    420
gctcccagac gatggttgca agaaatcact catgctggat aaaattgtgg atgtaagagt    480
ctgcagtcgt taaaatctgg aaacagcaca ttttgccgta gtaaatttga atccatgttg    540
ctgtctcgtt attggtgtgt tacgagtaac ctgtgtgttg ttatctccgc ttggactaga    600
ttccaagtaa tccagtgcct tcatgacctg caaattctat gcctatgaag taacatgaac    660
agtttgtatg tatgtattct gttgatgcat acttgcatta tttgtgagat gtacatgttg    720
tggtaaaatt ttgcattcac catatagaaa tagtaactga ctatccttgt ttagttcgaa    780
aactactgca ggtttagtta ttctctgttg ccaagagtgc ttgttatgat tgtaagggtt    840
acagttctgt gactaaccat gtaacaaata tattaaggat tatcaaatta ttctatgtga    900
agtgtccgtg ccctaattgt gttatcttct gtaactgata gcacaacatt tgtttcctgc     960
tgtgtgcttg tgtaaattgg tacttcatca ttactatata tttcaaagaa aattctgcat    1020
tgcattcccg tcgtccgttc taaatcagaa ctgacgattg ctctggtggc tgaagctcca    1080
gaaagaaagg gaaaaggctg aaaagaagaa agagaaaagg agtgacagga aagctcttcc    1140
acatggtgag atatccaagc attcaaagcg aacccaccac aagaagagaa aacatgaaga    1200
catcaataat gctgatcaga agtcccggaa ggtttcctcc atggaacctg gtgagcaatt    1260
ggagaagagt ggactctcag aagagcatgg agctccttgc tttactcaga cagagcatgg    1320
ctctccagag agttcacagg acagcagcaa gagaagaaag gttgtgttac ccagtcctag    1380
ccaagctaag aatggtgagg ccctttcttg catttgtctt cttttagctg gtgatgttga    1440
attggtttga cttatcctga attatcatct tgcaggtaac atccttcgaa taaagataag    1500
aagagatcaa gattcttcag cttccctttc ggagaaatct aatgttgtac aaacaccagt    1560
tcatcaaatg ggatcagttt catctctgcc aagtaagaaa aactcaatgc aaccacacaa    1620
caccgaaatg atggtgagaa cagcatcaac ccagcagcaa agcatcaaag gtgattttca    1680
agcagtaccg aaacaaggta tgccaacccc agcaaaagtc atgccaagag tcgatgttcc    1740
tccatctatg agggcatcaa aggaaaggat tggccttcgt cctgcagaga tgttggccaa    1800
tgttggtcct tcaccctcca aggcaaaaca gattgtcaat cctgcagctg ctaaggttac    1860
acaaagagtt gatcctccac ctgccaaggc atctcagaga attgatcctc tgttgccatc    1920
caaggttcat atagatgcta ctcgatcttt tacgaaggtc tcccagacag agatcaagcc    1980
ggaagtacag cccccaattc tgaaggtgcc tgtggctatg cctaccatca atcgtcagca    2040
gattgacacc tcgcagccca aagaagagcc ttgctcctct ggcaggaatg ctgaagctgc    2100
ttcagtatca gtagagaagc agtccaagtc agatcgcaaa aagagccgca aggctgagaa    2160
gaaagagaag aagttcaaag atttatttgt tacctgggat cctccgtcta tggaaatgga    2220
tgatatggat ctcggggacc aggattggct gcttgatagt acgaggaaac ctgatgctgg    2280
cattggcaac tgcagagaaa ttgttgatcc acttacttct caatcagcag agcagttctc    2340
attgcagcct agggcgattc atttaccaga ccttcatgtc tatcagttgc catatgtggt    2400
tccattctag gtttgtgtag tgagatggag taggtgagaa g                        2441
<210>2
<211>1344
<212>DNA
<213>Oryza sativa cv.Azucena
<220>
<221>CDS
<222>(1)..(1344)
<400>2
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gct gaa aag aag aaa gag aaa agg agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
cac aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc    240
His Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser
65                  70                  75                  80
cgg aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga    288
Arg Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly
                85                  90                  95
ctc tca gaa gag cat gga gct cct tgc ttt act cag aca gag cat ggc    336
Leu Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Glu His Gly
            100                 105                 110
tct cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta    384
Ser Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu
        115                 120                 125
ccc agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata    432
Pro Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile
    130                 135                 140
aga aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt    480
Arg Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val
145                 150                 155                 160
gta caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt    528
Val Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser
                165                 170                 175
aag aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca    576
Lys Lys Asn Ser Met Gln Pro His Asn Thr G1u Met Met Val Arg Thr
            180                 185                 190
gca tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ccg    624
Ala Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Pro
        195                 200                 205
aaa caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt    672
Lys Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val
    210                 215                 220
cct cca tct atg agg gca tca aag gaa agg att ggc ctt cgt cct gca    720
Pro Pro Ser Met Arg Ala Ser Lys Glu Arg Ile Gly Leu Arg Pro Ala
225                 230                 235                 240
gag atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att     768
Glu Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile
                245                 250                 255
gtc aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct     816
Val Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro
            260                 265                 270
gcc aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat     864
Ala Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His
        275                 280                 285
ata gat gct act cga tct ttt acg aag gtc tcc cag aca gag atc aag     912
Ile Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys
    290                 295                 300
ccg gaa gta cag ccc cca att ctg aag gtg cct gtg gct atg cct acc     960
Pro Glu Val Gln Pro Pro Ile Leu Lvs Val Pro Val Ala Met Pro Thr
305                 310                 315                 320
atc aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc    1008
Ile Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys
                325                 330                 335
tcc tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag    1056
Ser Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln
            340                 345                 350
tcc aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag    1104
Ser Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys
        355                 360                 365
aag ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg    1152
Lys Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met
    370                 375                 380
gat gat atg gat ctc ggg gac cag gat tgg ctg ctt gat agt acg agg    1200
Asp Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Asp Ser Thr Arg
385                 390                 395                 400
aaa cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt    1248
Lys Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu
                405                 410                 415
act tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat    1296
Thr Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His
            420                 425                 430
tta cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag    1344
Leu Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>3
<211>447
<212>PRT
<213>Oryza sativa cv.Azucena
<400>3
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
His Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser
65                  70                  75                  80
Arg Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly
                85                  90                  95
Leu Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Glu His Gly
            100                 105                 110
Ser Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu
        115                 120                 125
Pro Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile
    130                 135                 140
Arg Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val
145                 150                 155                 160
Val Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser
                165                 170                 175
Lys Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr
            180                 185                 190
Ala Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Pro
        195                 200                 205
Lys Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val
    210                 215                 220
Pro Pro Ser Met Arg Ala Ser Lys Glu Arg Ile Gly Leu Arg Pro Ala
225                 230                 235                 240
Glu Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile
                245                 250                 255
Val Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro
            260                 265                 270
Ala Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His
        275                 280                 285
Ile Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys
    290                 295                 300
Pro Glu Val Gln Pro Pro Ile Leu Lys Val Pro Val Ala Met Pro Thr
305                 310                 315                 320
Ile Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys
                325                 330                 335
Ser Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln
            340                 345                 350
Ser Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys
        355                 360                 365
Lys Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met
    370                 375                 380
Asp Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Asp Ser Thr Arg
385                 390                 395                 400
Lys Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu
            405                 410                 415
Thr Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His
        420                 425                 430
Leu Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
    435                 440                 445
<210>4
<211>126
<212>DNA
<213>Oryza sativa cv.Nipponbare
<400>4
gggggtgagc ttaggccgga cgccggggca tcagccatgt cgaggtgctt cccctacccg    60
ccgccggggt acgtgcgaaa cccagtggtg gccgtggccg cggccgaagc gcaggcgacc    120
actaag                                                               126
<210>5
<211>1344
<212>DNA
<213>Oryza sativa cv.Nipponbare
<220>
<221>CDS
<222>(1)..(1344)
<400>5
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gct gaa aag aag aaa gag aaa agg agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
cac aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc    240
His Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser
65                  70                  75                  80
cgg aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga    288
Arg Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly
                85                  90                  95
ctc tca gaa gag cat gga gct cct tgc ttt act cag aca gag cat ggc    336
Leu Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Glu His Gly
            100                 105                 110
tct cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta    384
Ser Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu
        115                 120                 125
ccc agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata    432
Pro Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile
    130                 135                 140
aga aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt    480
Arg Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val
145                 150                 155                 160
gta caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt    528
Val Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser
                165                 170                 175
aag aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca     576
Lys Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr
            180                 185                 190
gca tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ccg     624
Ala Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Pro
        195                 200                 205
aaa caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt     672
Lys Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val
    210                 215                 220
cct cca tct atg agg gca tca aag gaa agg att ggc ctt cgt cct gca     720
Pro Pro Ser Met Arg Ala Ser Lys Glu Arg Ile Gly Leu Arg Pro Ala
225                 230                 235                 240
gag atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att     768
Glu Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile
                245                 250                 255
gtc aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct     816
Val Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro
            260                 265                 270
gcc aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat     864
Ala Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His
        275                 280                 285
ata gat gct act cga tct ttt acg aag gtc tcc cag aca gag atc aag     912
Ile Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys
    290                 295                 300
ccg gaa gta cag ccc cca att ctg aag gtg cct gtg gct atg cct acc     960
Pro Glu Val Gln Pro Pro Ile Leu Lys Val Pro Val Ala Met Pro Thr
305                 310                 315                 320
atc aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc    1008
Ile Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys
                325                 330                 335
tcc tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag    1056
Ser Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln
            340                 345                 350
tcc aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag    1104
Ser Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys
        355                 360                 365
aag ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg    1152
Lys Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met
    370                 375                 380
gat gat atg gat ctc ggg gac cag gat tgg ctg ctt gat agt acg agg    1200
Asp Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Asp Ser Thr Arg
385                 390                 395                 400
aaa cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt    1248
Lys Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu
                405                 410                 415
act tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat    1296
Thr Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His
            420                 425                 430
tta cca gac ctt cat gtc tat cag ttg ccs tat gtg gtt cca ttc tag    1344
Leu Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>6
<211>447
<212>PRT
<213>Oryza sativa cv.Nipponbare
<400>6
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
His Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser
65                  70                  75                  80
Arg Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly
                85                  90                  95
Leu Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Glu His Gly
            100                 105                 110
Ser Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu
        115                 120                 125
Pro Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile
    130                 135                 140
Arg Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val
145                 150                 155                 160
Val Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser
                165                 170                 175
Lys Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr
            180                 185                 190
Ala Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Pro
        195                   200                 205
Lys Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val
    210                 215                 220
Pro Pro Ser Met Arg Ala Ser Lys Glu Arg Ile Gly Leu Arg Pro Ala
225                 230                 235                 240
Glu Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile
                245                 250                 255
Val Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro
            260                 265                 270
Ala Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His
        275                 280                 285
Ile Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys
    290                 295                 300
Pro Glu Val Gln Pro Pro Ile Leu Lys Val Pro Val Ala Met Pro Thr
305                 310                 315                 320
Ile Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys
                325                 330                 335
Ser Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln
            340                 345                 350
Ser Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys
        355                 360                 365
Lys Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met
    370                 375                 380
Asp Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Asp Ser Thr Arg
385                 390                 395                 400
Lys Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu
                405                 410                 415
Thr Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His
            420                 425                 430
Leu Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>7
<211>2461
<212>DNA
<213>Oryza sativa cv.Teqing
<400>7
gcggacgcgg gacatcagcc atgtcgaggt gcttccccta cccgccgccg gggtacgtgc      60
gaaacccagt ggtggccgtg gccgcggccg aagcgcaggc gaccactaag gtttgttgaa     120
ccatcggatt tacacacgca cgtgccggat catttgctct tgcctgttgg ttttgatcgg     180
atctgttggt tgtgcgtgtg tgatttgggg atcgcacgtg cggggaagct aacctttgca     240
tggataactt gagatttgtg aggccgcgct tcgaccagat cggtcgccaa tcttttagtg     300
gctgaccgtg gaaagaggat attactgacc ttcggtttgc taattttggt tgtgccgttg     360
aatctgaaat aaccagaata gtcatgggga aaaaagtctg atctggaagg ttcgaattac     420
atttctatat attgttgtgc tcccagacga tggttgcaag aaattactca tgctggataa     480
aattgtggat gtaagagtct gcagttgtta aaatctggaa acagcacatt ttgccgtagt     540
aaatttgaat ccatgttgct gtctcgttat tggtgtgtta cgagtaacct gtgtgttgtt     600
atctccgctt ggactagatt ccaagtaatc cagtgccttc atgacctgca aattctatgc     660
ctatgaagta acatgaacag tttgtatgta ttctgttgat gcatacttgc attatttgtg     720
agatgtacat gttgtggtaa aattttgcat tcaccatata gaaatagtaa ctgactatcc     780
ttgtttagtt cgaaaactac tgcaggttta gttattctct gttgccaaga gtgcttgtta     840
tgattgtaag ggttacagtt ctgtgactaa ccatgtaaca aatatattaa ggattatcaa     900
attattctat gtgaagtgtc cgtgccctaa ttgtgttatc ttctgtaact gatagcacaa     960
catttgtttc ctgctgtgtg cttgtgtaaa ttggtacttc atcattacta tatatttcaa    1020
agaaaattct gcattgcatt cccgtcgtcc gttctaaatc agaactgacg attgctctgg    1080
tggctgaagc tccagaaaga aagggaaaag gccgaaaaga agaaagagaa aaagagtgac    1140
aggaaagctc ttccacatgg tgagatatcc aagcattcaa agcgaaccca caagaagaga    1200
aaacatgaag acatcaataa tgctgatcag aagtcccgga aggtttcctc catggaacct    1260
ggtgagcaat tggagaagag tggactctca gaagagcatg gagctccttg ctttactcag    1320
acagtgcatg gctctccaga gagttcacag gacagcagca agagaagaaa ggttgtgtta    1380
cccagtccta gccaagctaa gaatggtgag gccctttctt gcatttgtct tcttttagct    1440
ggtgatgttg aattggtttg acttatcctg aattatcatc ttgcaggtaa catccttcga    1500
ataaagataa gaagagatca agattcttca gcttcccttt cggagaaatc taatgttgta    1560
caaacaccag ttcatcaaat gggatcagtt tcatctctgc caagtaagaa aaactcaatg    1620
caaccacaca acaccgaaat gatggtgaga acagcatcaa cccagcagca aagcatcaaa    1680
ggtgattttc aagcagtact gaaacaaggt atgccaaccc cagcaaaagt catgccaaga    1740
gtcgatgttc ctccatctat gagggcatca aaggaaaggg ttggccttcg tcctgcagag    1800
atgttggcca atgttggtcc ttcaccatcc aaggcaaaac agattgtcaa tcctgcagct    1860
gctaaggtta cacaaagagt tgatcctcca cctgccaagg catctcagag aattgatcct    1920
ctgttgccat ccaaggttca tatagatgct actcgatctt ttacgaaggt ctcccagaca    1980
gagatcaagc cggaagtaca gcccccaatt ccgaaggtgc ctgtggctat gcctaccatc    2040
aatcgtcagc agattgacac ctcgcagccc aaagaagagc cttgctcctc tggcaggaat    2100
gctgaagctg cttcagtatc agtagagaag cagtccaagt cagatcgcaa aaagagccgc    2160
aaggctgaga agaaagagaa gaagttcaaa gatttatttg ttacctggga tcctccgtct    2220
atggaaatgg atgatatgga tcttggggac caggattggc tgcttggtag tacgaggaaa    2280
cctgatgctg gcattggcaa ctgcagagaa attgttgatc cacttacttc tcaatcagca    2340
gagcagttct cattgcagcc tagggcgatt catttaccag accttcatgt ctatcagttg    2400
ccatatgtgg ttccattcta ggtttgtgta gtgagatgga gtaggtgaga agtagagaga    2460
t                                                                    2461
<210>8
<211>1341
<212>DNA
<213>Oryza sativa cv.Teqing
<220>
<221>CDS
<222>(1)..(1341)
<400>8
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                 25                   30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa aag agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc    384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga    432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta    480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag    528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca    576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa    624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct    672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag    720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca cca tcc aag gca aaa cag att gtc    768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct gcc    816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata    864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct act cga tct ttt acg aag gtc tcc cag aca gag atc aag ccg    912
Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        1341
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>9
<211>446
<212>PRT
<213>Oryza sativa cv.Teqing
<400>9
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>10
<211>451
<212>DNA
<213>Oryza sativa cv.Lemont
<400>10
cgccacgcga aaccaaatcc cgccgcgcgg gatccttttc cgccggattc cacccgcgaa     60
tcggggttcc ccttacgatt cgcgggcgga ttagcgcgag gcgcgcctcc ccctacctct    120
gtgtgatccg ggggtgaggt taggccggac gccggggcat cagccatgtc gaggtgcttc    180
ccctacccgc cgccggggta cgtgcgaaac ccagtggtgg ccgtggccgc ggccgaagcg    240
caggcgacca ctaaggtttg ttgaaccatc ggatttacac acgcacgtgc cggatcattt    300
gctcttgcct gttggttttg atcggatctg ttggttgtgc gtgtgtgatt tggggatcgc    360
acgtgcgggg aagctaacct ttgcatggat aacttgagat ttgtgaggcc gcgcttcgac    420
cagatcggtc gccaatcttt tagtggctga c                                   451
<210>11
<211>1616
<212>DNA
<213>Oryza sativa cv.Lemont
<400>11
acaaatatat taaggattat caaattattc tatgtgaagt gtccgtgccc taattgtgtt      60
atcttctgta actgatagca caacatttgt ttcctgctgt gtgcttgtgt aaattggtac     120
ttcatcatta ctatatattt caaagaaaat tctgcattgc attcccgtcg tccgttctaa     180
atcagaactg acgattgctc tggtggctga agctccagaa agaaagggaa aaggctgaaa     240
agaagaaaga gaaaaggagt gacaggaaag ctcttccaca tggtgagata tccaagcatt     300
caaagcgaac ccaccacaag aagagaaaac atgaagacat caataatgct gatcagaagt     360
cccggaaggt ttcctccatg gaacctggtg agcaattgga gaagagtgga ctctcagaag     420
agcatggagc tccttgcttt actcagacag agcatggctc tccagagagt tcacaggaca     480
gcagcaagag aagaaaggtt gtgttaccca gtcctagcca agctaagaat ggtgaggccc     540
tttcttgcat ttgtcttctt ttagctggtg atgttgaatt ggtttgactt atcctgaatt     600
atcatcttgc aggtaacatc cttcgaataa agataagaag agatcaagat tcttcagctt     660
ccctttcgga gaaatctaat gttgtacaaa caccagttca tcaaatggga tcagtttcat     720
ctctgccaag taagaaaaac tcaatgcaac cacacaacac cgaaatgatg gtgagaacag     780
catcaaccca gcagcaaagc atcaaaggtg attttcaagc agtaccgaaa caaggtatgc     840
caaccccagc aaaagtcatg ccaagagtcg atgttcctcc atctatgagg gcatcaaagg     900
aaaggattgg ccttcgtcct gcagagatgt tggccaatgt tggtccttca ccctccaagg     960
caaaacagat tgtcaatcct gcagctgcta aggttacaca aagagttgat cctccacctg    1020
ccaaggcatc tcagagaatt gatcctctgt tgccatccaa ggttcatata gatgctactc    1080
gatcttttac gaaggtctcc cagacagaga tcaagccgga agtacagccc ccaattctga    1140
aggtgcctgt ggctatgcct accatcaatc gtcagcagat tgacacctcg cagcccaaag    1200
aagagccttg ctcctctggc aggaatgctg aagctgcttc agtatcagta gagaagcagt    1260
ccaagtcaga tcgcaaaaag agccgcaagg ctgagaagaa agagaagaag ttcaaagatt    1320
tatttgttac ctgggatcct ccgtctatgg aaatggatga tatggatctc ggggaccagg    1380
attggctgct tgatagtacg aggaaacctg atgctggcat tggcaactgc agagaaattg    1440
ttgatccact tacttctcaa tcagcagagc agttctcatt gcagcctagg gcgattcatt    1500
taccagacct tcatgtctat cagttgccat atgtggttcc attctaggtt tgtgtagtga    1560
gatggagtag gtgagaagta gagagatgtt gggagagagc tgtgtgggtc tgggag        1616
<210>12
<211>1344
<212>DNA
<213>Oryza sativa cv.Lemont
<220>
<221>CDS
<222>(1)..(1344)
<400>12
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gct gaa aag aag aaa gag aaa agg agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
cac aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc    240
His Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser
65                  70                  75                  80
cgg aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga    288
Arg Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly
                85                  90                  95
ctc tca gaa gag cat gga gct cct tgc ttt act cag aca gag cat ggc    336
Leu Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Glu His Gly
            100                 105                 110
tct cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta    384
Ser Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu
        115                 120                 125
ccc agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata    432
Pro Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile
    130                 135                 140
aga aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt    480
Arg Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val
145                 150                 155                 160
gta caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt    528
Val Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser
                165                 170                 175
aag aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca    576
Lys Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr
            180                 185                 190
gca tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ccg    624
Ala Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Pro
        195                 200                 205
aaa caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt    672
Lys Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val
    210                 215                 220
cct cca tct atg agg gca tca aag gaa agg att ggc ctt cgt cct gca     720
Pro Pro Ser Met Arg Ala Ser Lys Glu Arg Ile Gly Leu Arg Pro Ala
225                 230                 235                 240
gag atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att     768
Glu Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile
                245                 250                 255
gtc aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct     816
Val Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro
            260                 265                 270
gcc aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat     864
Ala Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His
        275                 280                 285
ata gat gct act cga tct ttt acg aag gtc tcc cag aca gag atc aag     912
Ile Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys
    290                 295                 300
ccg gaa gta cag ccc cca att ctg aag gtg cct gtg gct atg cct acc     960
Pro Glu Val Gln Pro Pro Ile Leu Lvs Val Pro Val Ala Met Pro Thr
305                 310                 315                 320
atc aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc    1008
Ile Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys
                325                 330                 335
tcc tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag    1056
Ser Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln
            340                 345                 350
tcc aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag    1104
Ser Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys
        355                 360                 365
aag ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg    1152
Lys Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met
    370                 375                 380
gat gat atg gat ctc ggg gac cag gat tgg ctg ctt gat agt acg agg    1200
Asp Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Asp Ser Thr Arg
385                 390                 395                 400
aaa cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt    1248
Lys Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu
                405                 410                 415
act tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat    1296
Thr Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His
            420                 425                 430
tta cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag    1344
Leu Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>13
<211>447
<212>PRT
<213>Oryza sativa cv.Lemont
<400>13
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
His Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser
65                  70                  75                  80
Arg Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly
                85                  90                  95
Leu Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Glu His Gly
            100                 105                 110
Ser Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu
        115                 120                 125
Pro Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile
    130                 135                 140
Arg Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val
145                 150                 155                 160
Val Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser
                165                 170                 175
Lys Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr
            180                 185                 190
Ala Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Pro
        195                 200                 205
Lys Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val
    210                 215                 220
Pro Pro Ser Met Arg Ala Ser Lys Glu Arg Ile Gly Leu Arg Pro Ala
225                 230                 235                 240
Glu Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile
                245                 250                 255
Val Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro
            260                 265                 270
Ala Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His
        275                 280                 285
Ile Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys
    290                 295                 300
Pro Glu Val Gln Pro Pro Ile Leu Lys Val Pro Val Ala Met Pro Thr
305                 310                 315                 320
Ile Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys
                325                 330                 335
Ser Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln
            340                 345                 350
Ser Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys
        355                 360                 365
Lys Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met
    370                 375                 380
Asp Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Asp Ser Thr Arg
385                 390                 395                 400
Lys Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu
                405                 410                 415
Thr Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His
            420                 425                 430
Leu Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>14
<211>2459
<212>DNA
<213>Oryza sativa株IR64
<400>14
atgtcgaggt gcttccccta cccgccgccg gggtacgtgc gaaacccagt ggtggccgtg      60
gccgcggccg aagcgcaggc gaccactaag gtttgttgaa ccatcggatt tacacacgca     120
cgtgccggat catttgctct tgcctgttgg ttttgatcgg atctgttggt tgtgcgtgtg     180
tgatttgggg atcgcacgtg cggggaagct aacctttgca tggataactt gagatttgtg     240
aggccgcgct tcgaccagat cggtcgccaa tcttttagtg gctgaccgtg gaaagaggat     300
attactgacc ttcggtttgc taattttggt tgtgccgttg aatctgaaat aaccagaata     360
gtcatgggga aaaagtctga tctggaaggt tcgaattaca tttctatata ttgttgtgct     420
cccagacgat ggttgcaaga aattactcat gctggataaa attgtggatg taagagtctg     480
cagttgttaa aatctggaaa cagcacattt tgccgtagta aatttgaatc catgttgctg     540
tctcgttatt ggtgtgttac gagtaacctg tgtgttgtta tctccgcttg gactagattc     600
caagtaatcc agtgccttca tgacctgcaa attctatgcc tatgaagtaa catgaacagt     660
ttgtatgtat tctgttgatg catacttgca ttatttgtga gatgtacatg ttgtggtaaa     720
attttgcatt caccatatag aaatagtaat tgactatcct tgtttagttc gaaaactact     780
gcaggtttag ttattctctg ttgccaagag tgcttgttat gattgtaagg gttacagttc     840
tgtgactaac catgtaacaa atatattaag gattatcaaa ttattctatg tgaagtgtcc     900
gtgccctaat tgtgttatct tctgtaactg atagcacaac atttgtttcc tgctgtgtgc     960
ttgtgtaaat tggtacttca tcattactat atatttcaaa gaaaattctg cattgcattc    1020
ccgtcgtccg ttctaaatca gaactgacga ttgctctggt ggctgaagct ccagaaagaa    1080
agggaaaagg ccgaaaagaa gaaagagaaa aggagtgaca ggaaagctct tccacatggt    1140
gagatatcca agcattcaaa gcgaacccac aagaagagaa aacatgaaga catcaataat    1200
gctgatcaga agtcccggaa ggtttcctcc atggaacctg gtgagcaatt ggagaagagt    1260
ggactctcag aagagcatgg agctccttgc tttactcaga cagtgcatgg ctctccagag    1320
agttcacagg acagcagcaa gagaagaaag gttgtgttac ccagtcctag ccaagctaag    1380
aatggtgagg ccctttcttg catttgtctt cttttagctg gtgatgttga attggtttga    1440
cttatcctga attatcatct tgcaggtaac atccttcgaa taaagataag aagagatcaa    1500
gattcttcag cttccctttc ggagaaatct aatgttgtac aaacaccagt tcatcaaatg    1560
ggatcagttt catctctgcc aagtaagaaa aactcaatgc aaccacacaa caccgaaatg    1620
atggtgagaa cagcatcaac ccagcagcaa agcatcaaag gtgattttca agcagtactg    1680
aaacaaggta tgccaacccc agcaaaagtc atgccaagag tcgatgttcc tccatctatg    1740
agggcatcaa aggaaagggt tggccttcgt cctgcagaga tgttggccaa tgttggtcct    1800
tcaccctcca aggcaaaaca gattgtcaat cctgcagctg ctaaggttac acaaagagtt    1860
gatcctccac ctgccaaggc atctcagaga attgatcctc tgttgccatc caaggttcat    1920
atagatgcta ctcgatcttt tacgaagctc tcccagacag agatcaagcc ggaagtacag    1980
cccccaattc cgaaggtgcc tgtggctatg cctaccatca atcgtcagca gattgacacc    2040
tcgcagccca aagaagagcc ttgctcctct ggcaggaatg ctgaagctgc ttcagtatca    2100
gtagagaagc agtccaagtc agatcgcaaa aagagccgca aggctgagaa gaaagagaag    2160
aagttcaaag atttatttgt tacctgggat cctccgtcta tggaaatgga tgatatggat    2220
cttggggacc aggattggct gcttggtagt acgaggaaac ctgatgctgg cattggcaac    2280
tgcagagaaa ttgttgatcc acttacttct caatcagcgg agcagttctc attgcagcct    2340
agggcgattc atttaccaga ccttcatgtc tatcagttgc catatgtggt tccattctag    2400
gtttgtgtag tgagatggag taggtgagaa gtagagagat gttgggagag agctgtgtg     2459
<210>15
<211>1341
<212>DNA
<213>Oryza sativa株IR64
<220>
<22l>CDS
<222>(1)..(1341)
<400>15
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75              80
aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90              95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc     384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga     432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta     480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag     528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca     576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa     624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct     672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag     720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att gtc     768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt acs caa aga gtt gat cct cca cct gcc     816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata     864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct sct cga tct ttt acg aag ctc tcc cag aca gag atc aag ccg     912
Asp Ala Thr Arg Ser Phe Thr Lys Leu Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gcg gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        1341
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>16
<211>446
<212>PRT
<213>Oryza sativa株IR64
<400>16
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Leu Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 333                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>17
<211>2432
<212>DNA
<213>Oryza sativa cv.Kasalath
<220>
<221>misc_feature
<222>(1950)..(1950)
<223>N=G或C
<220>
<221>misc_feature
<222>(2032)..(2032)
<223>N=G或C
<400>17
catgtcgagg tgcttcccct acccgccgcc ggggtacgtg cgaaacccag tggtggccgt     60
ggccgcggcc gaagcgcagg cgaccactaa ggtttgttga accatcggat ttacacacgc    120
acgtgccgga tcatttgctc ttgcctgttg gttttgatcg gatctgttgg ttgtgcgtgt    180
gtgatttggg gatcgcacgt gcggggaagc taacctttgc atggataact tgagatttgt    240
gaggccgcgc ttcgaccaga tcggtcgcca atcttttagt ggctgaccgt ggaaagagga    300
tattactgac cttcggtttg ctaattttgg ttgtgccgtt gaatctgaaa taaccagaat    360
agtcatgggg aaaaaagtct gatctggaag gttcgaatta catttctata tattgttgtg    420
ctcccagacg atggttgcaa gaaattactc atgctggata aaattgtgga tgtaagagtc    480
tgcagttgtt aaaatctgga aacagcacat tttgccgtag taaatttgaa tccatgttgc    540
tgtctcgtta ttggtgtgtt acgagtaacc tgtgtgttgt tatctccgct tggactagat    600
tccaagtaat ccagtgcctt catgacctgc aaattctatg cctatgaagt aacatgaaca     660
gtttgtatgt attctgttga tgcatacttg cattatttgt gagatgtaca tgttgtggta     720
aaattttgca ttcaccatat agaaatagta actgactatc cttgtttagt tcgaaaacta     780
ctgcaggttt agttattctc tgttgccaag agtgcttgtt atgattgtaa gggttacagt     840
tctgtgacta accatgtaac aaatatatta aggattatca aattattcta tgtgaagtgt     900
ccgtgcccta attgtgttat cttctgtaac tgatagcaca acatttgttt cctgctgtgt     960
gcttgtgtaa attggtactt catcattact atatatttca aagaaaattc tgcattgcat    1020
tcccgtcgtc cgttctaaat cagaactgac gattgctctg gtggctgaag ctccagaaag    1080
aaagggaaaa ggccgaaaag aagaaagaga aaaggagtga caggaaagct cttccacatg    1140
gtgagatatc caagcattca aagcgaaccc acaagaagag aaaacatgaa gacatcaata    1200
atgctgatca gaagtcccgg aaggtttcct ccatggaacc tggtgagcaa ttggagaaga    1260
gtggactctc agaagagcat ggagctcctt gctttactca gacagtgcat ggctctccag    1320
agagttcaca ggacagcagc aagagaagaa aggttgtgtt acccagtcct agccaagcta    1380
agaatggtga ggccctttct tgcatttgtc ttcttttagc tggtgatgtt gaattggttt    1440
gacttatcct gaattatcat cttgcaggta acatccttcg aataaagata agaagagatc    1500
aagattcttc agcttccctt tcggagaaat ctaatgttgt acaaacacca gttcatcaaa    1560
tgggatcagt ttcatctctg ccaagtaaga aaaactcaat gcaaccacac aacaccgaaa    1620
tgatggtgag aacagcatca acccagcagc aaagcatcaa aggtgatttt caagcagtac    1680
tgaaacaagg tatgccaacc ccagcaaaag tcatgccaag agtcgatgttcctccatcta     1740
tgagggcatc aaaggaaagg gttggccttc gtcctgcaga gatgttggcc aatgttggtc    1800
cttcaccctc caaggcaaaa cagattgtca atcctgcagc tgctaaggtt acacaaagag    1860
ttgatcctcc acctgccaag gcatctcaga gaattgatcc tctgttgcca tccaaggttc    1920
atatagatgc tactcgatct tttacgaagn tctcccagac agagatcaag ccggaagtac    1980
agcccccaat tccgaaggtg cctgtggcta tgcctaccat caatcgtcag cngattgaca    2040
cctcgcagcc caaagaagag ccttgctcct ctggcaggaa tgctgaagct gcttcagtat    2100
cagtagagaa gcagtccaag tcagatcgca aaaagagccg caaggctgag aagaaagaga    2160
agaagttcaa agatttattt gttacctggg atcctccgtc tatggaaatg gatgatatgg    2220
atcttgggga ccaggattgg ctgcttggta gtacgaggaa acctgatgct ggcattggca    2280
actgcagaga aattgttgat ccacttactt ctcaatcagc agagcagttc tcattgcagc    2340
ctagggcgat tcatttacca gaccttcatg tctatcagtt gccatatgtg gttccattct    2400
aggtttgtgt agtgagatgg agtaggtgag aa                                     2432
<210>18
<211>1341
<212>DNA
<213>Oryza sativa cv.Kasalath
<220>
<221>CDS
<222>(1)..(1341)
<220>
<221>misc_feature
<222>(889)..(889)
<223>n=G,C
<220>
<221>misc_feature
<222>(971)..(971)
<223>n=A,T
<400>18
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc    384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga    432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta    480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag     528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca     576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa     624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct     672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag     720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att gtc     768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct gcc     816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata     864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct act cga tct ttt acg aag ntc tcc cag aca gag atc aag ccg     912
Asp Ala Thr Arg Ser Phe Thr Lys Xaa Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cng att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Xaa Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        1341
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>19
<211>446
<212>PRT
<213>Oryza sativa cv.Kasalath
<220>
<221>misc_feature
<222>(297)..(297)
<223>位置297处Xaa代表Ile,Val,Leu,或Phe.
<220>
<221>misc_feature
<222>(324)..(324)
<223>位置324处Xaa代表Gln,Arg,Pro,或Leu.
<400>19
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Xaa Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Xaa Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>20
<211>2447
<212>DNA
<213>Oryza rufipogon株5948
<400>20
ccctacccgc cgccggggta cgtgcgaaac ccagtggtgg ccgtggccgc ggccgaagcg      60
caggcgacca ctaaggtttg ttgaaccatc ggatttacac acgcacgtgc cggatcattt     120
gctcttgcct gttggttttg atcggatctg ttggttgtgc gtgtgtgatt tggggatcgc     180
acgtgcgggg aagctaacct ttgcatggat aacttgagat ttgtgaggcc gcgcttcgac     240
cagatcggtc gccaatcttt tagtggctga ccgtggaaag aggatattac tgaccttcgg     300
tttgctaatt ttggttgtgc cgttgaatct gaaataacca gaatagtcat ggggaaaaag     360
tctgatctgg aaggttcgaa ttacatttct atatattgtt gtgctcccag acgatggttg     420
caagaaatta ctcatgctgg ataaaattgt ggatgtaaga gtctgcagtt gttaaaatct     480
ggaaacagca cattttgccg tagtaaattt gaatccatgt tgctgtctcg ttattggtgt     540
gttacgagta acctgtgtgt tgttatctcc gcttggacta gattccaagt aatccagtgc     600
cttcatgacc tgcaaattct atgcctatga agtaacatga acagtttgta tgtattctgt     660
tgatgcatac ttgcattatt tgtgagatgt acatgttgtg gtaaaatttt gcattcacca     720
tatagaaata gtaattgact atccttgttt agttcgaaaa cttctgcagg tttagttatt     780
ctctgttgcc aagagtgctt gttatgattg taagggttac agttctgtga ctaaccatgt     840
aacaaatata ttaaggatta tcaaattatt ctatgtgaag tgtccgtgcc ctaattgtgt     900
tatcttctgt aactgatagc acaacatttg tttcctgctg tgtgcttgtg taaattggta     960
cttcatcatt actatatatt tcaaagaaaa ttctgcattg cattcccgtc gtccgttcta    1020
aatcagaact gacgattgct ctggtggctg aagctccaga aagaaaggga aaaggccgaa    1080
aagaagaaag agaaaaggag tgacaggaaa gctcttccac atggtgagat atccaagcat    1140
tcaaagcgaa cccacaagaa gagaaaacat gaagacatca ataatgctga tcagaagtcc    1200
cggaaggttt cctccatgga acctggtgag caattggaga agagtggact ctcagaagag    1260
catggagctc cttgctttac tcagacagtg catggctctc cagagagttc acaggacagc    1320
agcaagagaa gaaaggttgt gttacccagt cctagccaag ctaagaatgg tgaggccctt    1380
tcttgcattt gtcttctttt agctggtgat gttgaattgg tttgacttat cctgaattat    1440
catcttgcag gtaacatcct tcgaataaag ataagaagag atcaagattc ttcagcttcc    1500
ctttcggaga aatctaatgt tgtacaaaca ccagttcatc aaatgggatc agtttcatct    1560
ctgccaagta agaaaaactc aatgcaacca cacaacaccg aaatgatggt gagaacagca    1620
tcaacccagc agcaaagcat caaaggtgat tttcaagcag tactgaaaca aggtatgcca    1680
accccagcaa aagtcatgcc aagagtcgat gttcctccat ctatgagggc atcaaaggaa    1740
agggttggcc ttcgtcctgc agagatgttg gccaatgttg gtccttcacc ctccaaggca    1800
aaacagattg tcaatcctgc agctgctaag gttacacaaa gagttgatcc tccacctgcc    1860
aaggcatctc agagaattga tcctctgttg ccatccaagg ttcatataga tgctsctcga    1920
tcttttacga agctctccca gacsgagatc aagccggaag tacsgccccc aattccgaag    1980
gtgcctgtgg ctatgcctac catcastcgt cagcagattg acacctcgca gcccaaagaa    2040
gagccttgct cctctggcag gaatgctgaa gctgcttcag tatcagtaga gaagcagtcc    2100
aagtcagatc gcaaaaagag ccgcaaggct gagaagaaag agaagaagtt caaagattta    2160
tttgttacct gggatcctcc gtctatggaa atggatgata tggatcttgg ggaccaggat    2220
tggctgcttg gtagtacgag gaaacctgat gctggcattg gcaactgcag agaaattgtt    2280
gatccactta cttctcaatc agcggagcag ttctcattgc agcctagggc gattcattta    2340
ccagaccttc atgtctatca gttgccatat gtggttccat  tctaggtttg tgtagtgaga   2400
tggagtaggt gagaagtaga gagatgttgg gagagagctg tgtgggt                  2447
<210>21
<211>1341
<212>DNA
<213>Oryza rufipogon株5948
<220>
<221>CDS
<222>(1)..(1341)
<220>
<221>misc_feature
<222>(1)..(15)
<223>n=A,C,G,T
<400>21
nnn nnn nnn nnn nnn ccc tac ccg ccg ccg ggg tac gtg cga aac cca     48
Xaa Xaa Xaa Xaa Xaa Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc    384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga    432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta    480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag    528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca    576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa    624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct    672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag     720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att gtc     768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct gcc     816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata     864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct act cga tct ttt acg aag ctc tcc cag aca gag atc aag ccg     912
Asp Ala Thr Arg Ser Phe Thr Lys Leu Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Pha Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gcg gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        1341
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>22
<211>446
<212>PRT
<213>Oryza rufipogon株.5948
<220>
<221>misc_feature
<222>(1)..(1)
<223>位置1处Xaa代表                     Lys,Asn,Arg,ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(2)..(2)
<223>位置2处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(3)..(3)
<223>位置3处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(4)..(4)
<223>位置4处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(5)..(5)
<223>位置5处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<400>22
Xaa Xaa Xaa Xaa Xaa Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys yal His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Leu Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 4l0                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>23
<211>146
<212>DNA
<213>Oryza rufipogon株5949
<400>23
cccctacctc tgtgtgatcc gggggtgagc ttaggccgga cgccggggca tcagccatgt     60
cgaggtgctt cccctacccg ccgccggggt acgtgcgaaa cccagtggtg gccgtggccg    120
cggccgaagc gcaggcgacc actaag                                         146
<210>24
<211>1615
<212>DNA
<213>Oryza rufipogon株5949
<400>24
tctgtgacta accatgtaac aaatatatta aggattatca aattattcta tgtgaagtgt     60
ccgtgcccta attgtgttat cttctgtaac tgatagcaca acatttgttt cctgctgtgt    120
gcttgtgtaa attggtactt catcattact atatatttca aagaaaattc tgcattgcat    180
tcccgtcgtc cgttctaaat cagaactgac gattgctctg gtggctgaag ctccagaaag    240
aaagggaaaa ggccgaaaag aagaaagaga aaaagagtga caggaaagct cttccacatg    300
gtgagatatc caagcattca aagcgaaccc acaagaagag aaaacatgaa gacatcaata    360
atgctgatca gaagtcccgg aaggtttcct ccatggaacc tggtgagcaa ttggagaaga     420
gtggactctc agaagagcat ggagctcctt gctttactca gacagtgcat ggctctccag     480
agagttcaca ggacagcagc aagagaagaa aggttgtgtt acccagtcct agccaagcta     540
agaatggtga ggccctttct tgcatttgtc ttctcttagc tggtgatgtt gaattggttt     600
gacttatcct gaattatcat cttgcaggta acatccttcg aataaagata agaagagatc     660
aagattcttc agcttccctt tcggagaaat ctastgttgt acaaacacca gttcatcaaa     720
tgggatcagt ttcatctctg ccaagtaaga aaaactcaat gcaaccacac aacaccgaaa     780
tgatggtgag aacagcatca acccagcagc aaagcatcaa aggtgatttt caagcagtac     840
tgaaacaagg tatgccaacc ccagcaaaag tcatgccaag agtcgatgtt cctccatcta     900
tgagggcatc aaaggaaagg gttggccttc gtcctgcaga gatgttggcc aatgttggtc     960
cttcaccatc caaggcaaaa cagattgtca atcctgcagc tgctaaggtt acacaaagag    1020
ttgatcctcc acctgccaag gcatctcaga gaattgatcc tctgttgcca tccaaggttc    1080
atatagatgc tactcgatct tttacgaagg tctcccagac agagatcaag ccggaagtac    1140
agcccccaat tccgaaggtg cctgtggcta tgcctaccat caatcgtcag cagattgaca    1200
cctcgcagcc caaagaagag ccttgctcct ctggcaggaa tgctgaagct gcttcagtat    1260
cagtagagaa gcagtccaag tcagatcgca aaaagagccg caaggctgag aagaaagaga    1320
agaagttcaa agatttattt gttacctggg atcctccgtc tatggaaatg gatgatatgg    1380
atcttgggga ccaggattgg ctgcttggta gtacgaggaa acctgatgct ggcattggca    1440
actgcagaga aattgttgat ccacttactt ctcaatcagc agagcagttc tcattgcagc    1500
ctagggcgat tcatttacca gaccttcatg tctatcagtt gccatatgtg gttccattct    1560
aggtttgtgt agtgagatgg agtaggtgag aagtagagag atgttgggag agagc         1615
<210>25
<211>1341
<212>DNA
<213>Oryza rufipogon株5949
<220>
<221>CDS
<222>(1)..(1341)
<400>25
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca    48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag    96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa aag agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc    384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga    432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta    480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag    528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca    576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa    624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct    672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag    720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca cca tcc aag gca aaa cag att gtc    768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct gcc    816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata     864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct act cga tct ttt acg aag gtc tcc cag aca gag atc aag ccg     912
Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        1341
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>26
<211>446
<212>PRT
<213>Oryza rufipogon株5949
<400>26
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
Lys Ala Lau Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Lau Pro Ser Lys Val His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>27
<211>107
<212>DNA
<213>Oryza rufipogon株5953
<400>27
acgccggggc atcagccatg tcgaggtgct tcccctaccc gccgccgggg tacgtgcgaa    60
acccagtggt ggccgtggcc gcggccgaag cgcaggcgac cactaag                 107
<210>28
<211>1332
<212>DNA
<213>Oryza rufipogon株5953
<400>28
ctccagaaag aaagggaaaa ggccgaaaag aagaaagaga aaaagagtga caggaaagct    60
cttccacatg gtgagatatc caagcattca aagcgaaccc acaagaagag aaaacatgaa     120
gacatcaata atgctgatca gaagtcccgg aaggtttcct ccatggaacc tggtgagcaa     180
ttggagaaga gtggactctc agaagagcat ggagctcctt gctttactca gacagtgcat     240
ggctctccag agagttcaca ggacagcagc aagagaagaa aggttgtgtt acccagtcct     300
agccaagcta agaatggtga ggccctttct tgcatttttc ttcttttagc tggtgatgtt     360
gaattggttt gacttatcct gaattatcat cttgcaggta acatccttcg aataaagata     420
agaagagatc aagattcttc agcttccctt tcggagaaat ctaatgttgt acaaacacca     480
gttcatcaaa tgggatcagt ttcatctctg ccaagtaaga aaaactcaat gcaaccacac     540
aacaccgaaa tgatggtgag aacagcatca acccagcagc aaagcatcaa aggtgatttt     600
caagcagtac tgaaacaagg tatgccaacc ccagcaaaag tcatgccaag agtcgatgtt     660
cctccatcta tgagggcatc aaaggaaagg gttggccttc gtcctgcaga gatgttggcc     720
aatgttggtc cttcaccctc caaggcaaaa cagattgtca atcctgcagc tgctaaggtt     780
acacaaagag ttgatcctcc acctgccaag gcatctcaga gaattgatcc tctgttgcca     840
tccaaggttc atatagatgc tactcgatct tttacgaagc tctcccagac agagatcaag     900
ccggaagtsc agcccccaat tccgaaggtg cctgtggcta tgcctaccat caatcgtcag     960
cagattgaca cctcgcagcc caaagaagag ccttgctcct ctggcaggaa tgctgaagct    1020
gcttcagtat cagtagagaa gcagtccaag tcagatcgca aaaagagccg caaggctgag    1080
aagaaagaga agaagttcaa agatttattt gttacctggg atcctccgtc tatggaaatg    1140
gatgatatgg atcttgggga ccaggattgg ctgcttggta gtacgaggaa acctgatgct    1200
ggcattggca actgcagaga aattgttgat ccacttactt ctcaatcagc ggagcagttc    1260
tcattgcagc ctagggcgat tcatttacca gaccttcatg tctatcagtt gccatatgtg    1320
gttccattct ag                                                        1332
<210>29
<211>1341
<212>DNA
<213>Oryza rufipogon株5953
<220>
<221>CDS
<222>(1)..(1341)
<400>29
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca    48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa aag agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
aag gtt tcc tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc    384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga    432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta    480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag    528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca    576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa    624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct    672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    2l0                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag    720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca ccc tcc aag gca aaa cag att gtc    768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct gcc    816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata     864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct act cga tct ttt acg aag ctc tcc cag aca gag atc aag ccg     912
Asp Ala Thr Arg Ser Phe Thr Lys Leu Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gcg gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        134l
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val VaL Pro Phe
        435                 440                 445
<210>30
<211>446
<212>PRT
<213>Oryza rufipogon株5953
<400>30
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Leu Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>31
<211>1341
<212>DNA
<213>Oryza rufipogon株IRCG105491
<220>
<221>CDS
<222>(1)..(1341)
<400>31
atg tcg agg tgc ttc ccc tac ccg ccg ccg ggg tac gtg cga aac cca    48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gtg gcc gtg gcc gcg gcc gaa gcg cag gcg acc act aag ctc cag     96
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
aaa gaa agg gaa aag gcc gaa aag aag aaa gag aaa aag agt gac agg    144
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
aaa gct ctt cca cat ggt gag ata tcc aag cat tca aag cga acc cac    192
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
aag aag aga aaa cat gaa gac atc aat aat gct gat cag aag tcc cgg    240
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
aag gtt tco tcc atg gaa cct ggt gag caa ttg gag aag agt gga ctc    288
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
tca gaa gag cat gga gct cct tgc ttt act cag aca gtg cat ggc tct    336
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
cca gag agt tca cag gac agc agc aag aga aga aag gtt gtg tta ccc    384
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
agt cct agc caa gct aag aat ggt aac atc ctt cga ata aag ata aga    432
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
aga gat caa gat tct tca gct tcc ctt tcg gag aaa tct aat gtt gta    480
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
caa aca cca gtt cat caa atg gga tca gtt tca tct ctg cca agt aag    528
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
aaa aac tca atg caa cca cac aac acc gaa atg atg gtg aga aca gca    576
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
tca acc cag cag caa agc atc aaa ggt gat ttt caa gca gta ctg aaa    624
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
caa ggt atg cca acc cca gca aaa gtc atg cca aga gtc gat gtt cct    672
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
cca tct atg agg gca tca aag gaa agg gtt ggc ctt cgt cct gca gag    720
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
atg ttg gcc aat gtt ggt cct tca cca tcc aag gca aaa cag att gtc    768
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
aat cct gca gct gct aag gtt aca caa aga gtt gat cct cca cct gcc     816
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
aag gca tct cag aga att gat cct ctg ttg cca tcc aag gtt cat ata     864
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
gat gct act cga tct ttt acg aag gtc tcc cag aca gag atc aag ccg     912
Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
gaa gta cag ccc cca att ccg aag gtg cct gtg gct atg cct acc atc     960
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
aat cgt cag cag att gac acc tcg cag ccc aaa gaa gag cct tgc tcc    1008
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
tct ggc agg aat gct gaa gct gct tca gta tca gta gag aag cag tcc    1056
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
aag tca gat cgc aaa aag agc cgc aag gct gag aag aaa gag aag aag    1104
Lys Set Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
ttc aaa gat tta ttt gtt acc tgg gat cct ccg tct atg gaa atg gat    1152
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
gat atg gat ctt ggg gac cag gat tgg ctg ctt ggt agt acg agg aaa    1200
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
cct gat gct ggc att ggc aac tgc aga gaa att gtt gat cca ctt act    1248
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
tct caa tca gca gag cag ttc tca ttg cag cct agg gcg att cat tta    1296
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
cca gac ctt cat gtc tat cag ttg cca tat gtg gtt cca ttc tag        1341
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>32
<211>446
<212>PRT
<213>Oryza rufipogon株IRCG105491
<400>32
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Val Ala Val Ala Ala Ala Glu Ala Gln Ala Thr Thr Lys Leu Gln
            20                  25                  30
Lys Glu Arg Glu Lys Ala Glu Lys Lys Lys Glu Lys Lys Ser Asp Arg
        35                  40                  45
Lys Ala Leu Pro His Gly Glu Ile Ser Lys His Ser Lys Arg Thr His
    50                  55                  60
Lys Lys Arg Lys His Glu Asp Ile Asn Asn Ala Asp Gln Lys Ser Arg
65                  70                  75                  80
Lys Val Ser Ser Met Glu Pro Gly Glu Gln Leu Glu Lys Ser Gly Leu
                85                  90                  95
Ser Glu Glu His Gly Ala Pro Cys Phe Thr Gln Thr Val His Gly Ser
            100                 105                 110
Pro Glu Ser Ser Gln Asp Ser Ser Lys Arg Arg Lys Val Val Leu Pro
        115                 120                 125
Ser Pro Ser Gln Ala Lys Asn Gly Asn Ile Leu Arg Ile Lys Ile Arg
    130                 135                 140
Arg Asp Gln Asp Ser Ser Ala Ser Leu Ser Glu Lys Ser Asn Val Val
145                 150                 155                 160
Gln Thr Pro Val His Gln Met Gly Ser Val Ser Ser Leu Pro Ser Lys
                165                 170                 175
Lys Asn Ser Met Gln Pro His Asn Thr Glu Met Met Val Arg Thr Ala
            180                 185                 190
Ser Thr Gln Gln Gln Ser Ile Lys Gly Asp Phe Gln Ala Val Leu Lys
        195                 200                 205
Gln Gly Met Pro Thr Pro Ala Lys Val Met Pro Arg Val Asp Val Pro
    210                 215                 220
Pro Ser Met Arg Ala Ser Lys Glu Arg Val Gly Leu Arg Pro Ala Glu
225                 230                 235                 240
Met Leu Ala Asn Val Gly Pro Ser Pro Ser Lys Ala Lys Gln Ile Val
                245                 250                 255
Asn Pro Ala Ala Ala Lys Val Thr Gln Arg Val Asp Pro Pro Pro Ala
            260                 265                 270
Lys Ala Ser Gln Arg Ile Asp Pro Leu Leu Pro Ser Lys Val His Ile
        275                 280                 285
Asp Ala Thr Arg Ser Phe Thr Lys Val Ser Gln Thr Glu Ile Lys Pro
    290                 295                 300
Glu Val Gln Pro Pro Ile Pro Lys Val Pro Val Ala Met Pro Thr Ile
305                 310                 315                 320
Asn Arg Gln Gln Ile Asp Thr Ser Gln Pro Lys Glu Glu Pro Cys Ser
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Ala Ser Val Ser Val Glu Lys Gln Ser
            340                 345                 350
Lys Ser Asp Arg Lys Lys Ser Arg Lys Ala Glu Lys Lys Glu Lys Lys
        355                 360                 365
Phe Lys Asp Leu Phe Val Thr Trp Asp Pro Pro Ser Met Glu Met Asp
    370                 375                 380
Asp Met Asp Leu Gly Asp Gln Asp Trp Leu Leu Gly Ser Thr Arg Lys
385                 390                 395                 400
Pro Asp Ala Gly Ile Gly Asn Cys Arg Glu Ile Val Asp Pro Leu Thr
                405                 410                 415
Ser Gln Ser Ala Glu Gln Phe Ser Leu Gln Pro Arg Ala Ile His Leu
            420                 425                 430
Pro Asp Leu His Val Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>33
<211>180
<212>DNA
<213>Zea mays mays株BS7
<400>33
gcatgtcgag gtgcttcccc tacccgccac cggggtacgt gcggaaccca gtggccgtgg     60
ccgagccgga gtcgaccgct aaggtttgtt gaaccttcgg atttacacac gcacgtgcca    120
gatcgtttgt tcaatctgta ggttttgcgc ggatctgtgt gtttgcgcgt gcgtgatgtg    180
<210>34
<211>1447
<212>DNA
<213>Zea mays mays株BS7
<400>34
tcagaactga cgattgctct ggtggctgaa gctcctgaaa gaaaaggaaa aggccgaaaa      60
gaagaaagag aaaaggagtg acaggaaagc tcccaagcag tgtgagacgt ccaaacattc     120
aaagcacagc cataagaaga gaaagcttga agatgtcatc aaagctgagc agggtcccaa     180
aagagtaccc aaagaatcag ttgagcagtt ggagaagagt ggactctcag aagagcatgg     240
agctccttct tttgtacata cgatacgtga ctctcctgag agctcacagg acagcggcaa     300
gagacgaaag gttgtcctgt ccagtcctag ccaacctaag aatggtgaga ctattctctt     360
gtttttgcta ttctgattga ttttttatta tagaagaaat caatcgcttg ttcaggattt     420
tattcatccc aacttgattt tacaggaaac attcttcgct tcaagattaa aagtagtcaa     480
gayccccaat cagctgttct ggagaaacca agggttcttg agcaaccatt ggtccaacaa     540
atgggatcag gttcatcccy gtcgggcaag caaaattcaa tccatcataa gatgaatgtg     600
agatctacct ctggtcagcg gagggtcgat ggtgactccc aagcagtaca aaaatgtttg     660
attacagaat ccccggcaaa gaccatgcag agacttgtcc cccagcctgc agctaaggtc     720
acacatcctg ttgatcccca gtcagctgtt aaggtgccag ttggaagatc gggcctacct     780
ctgaagtctt cgggaagtgt ggacccttcg cctgctagag ttatgagaag atttgatcct     840
ccacctgtta agatgatgtc acagagagtt caccatccag cttccatggt gtcgcagaaa     900
gttgatcctc cgtttccgaa ggtattacat aaggaaaccg gatctgttgt tcgcctacca     960
gaagctaccc ggcctactgt tcttcaaaaa cccaaggact tgcctgctat caagcagcag    1020
gatatcagga cctcttcctc aaaagaagag ccctgcttct ctggtaggaa tgcagaagca    1080
gttcaagtgc aagatactaa gctctcccgg tcagacatga agaaaatccg caaagctgag    1140
aaaaaagata agaagttcag agatctgttt gttacctgga atccggtatt gatagagaat    1200
gaaggttcag atcttggtga tgaagactgg ctgttcagca gtaaaaggaa ctccgatgct    1260
atcatggttc aaagcagagc tactgatagt tcagtgccga tccatccaat ggtgcagcag    1320
aagccttctt tacaacccag ggcaacattt ttgccggacc ttaatatgta ccagctgcca    1380
tatgtcgtac cattttaaac atctggcgag gtagatgaga attagatgag atgttgggag    1440
agagctg                                                              1447
<210>35
<211>1347
<212>DNA
<213>Zea mays mays株BS7
<220>
<221>CDS
<222>(1)..(1347)
<220>
<221>misc_feature
<222>(1)..(1347)
<223>位置170处Xaa代表Pro或Leu
<400>35
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag     96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gag agg aaa gct ccc    144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga    192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc    240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat    288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca    336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa    384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gay    432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg    480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc cyg tcg ggc aag caa aat tca    528
Val Gln Gln Met Gly Ser Gly Ser Ser Xaa Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc     576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
gat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg     624
Asp Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca     672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg     720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga     768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga     816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt     864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa     912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc     960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc    1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc    1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag    1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa    1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac    1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg    1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca    1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt    1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                1347
<210>36
<211>448
<212>PRT
<213>Zea mays mays株BS7
<220>
<221>misc_feature
<222>(170)..(170)
<223>位置170处Xaa代表Pro,或Leu.
<400>36
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Xaa Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asp Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>37
<211>2646
<212>DNA
<213>Zea mays mays株HuoBai
<400>37
gcggggtaga gcgcggtcga cgtcggcatg tcgaggtgct tcccctaccc gccaccgggg      60
tacgtgcgga acccagtggc cgtggccgag ccggagtcga ccgctaaggt ttgttgaacc     120
ttcggattta cacacgcacg tgccagatcg tttgttcaat ctgtaggttt tgcgcggatc     180
tgtggtttgc gcgtgcgtga tgtgggtatt gcccgtgcct tgaaagctaa ccgagctgag     240
gaagtgtatg gatcttgtgt agctgcacga ggtcctccaa atcgattgta aaatttaagt     300
tgtatggccg gtaggccaag attgggttat tccggttttc gaaaactggt agcatggtta     360
tcggggacat tgaaagaatg gtagaacatc aaattcgatt caaaactgtg ctagatttgc     420
atatttagtc gccctaaaat tacgtggacg tgggtgatcc gaattggttg ttgtatgatg     480
gttggaagtg actggccaaa tttttttgtt tctcaaagtt ttctttgaaa aactgtttgt     540
cgagcgtcaa ttcgtattta cctgaattta ctaattctta atacagtatg tcgttatttt     600
gggctaagct tgtgtaagaa gggtcgtttg acattttgta ctgtattgat gctgttttgt     660
gtttctttgt tcggagcagc attcaatgct ccttttgttg tttgagagaa tctgatattt     720
gccatcgtac cgaaagtccg aaaccaacta ttcaaattgg gatttcattt cttttttttt     780
ctactgtttt tagagttctc tttttcgctg ctgtgctctt gtgggtcagt acgtgcattt     840
ctcttttttt cttttttttt ctgatgttac tcttctgttg accaaaggag ttcagaatta     900
ttttggccct gtatatcaat agcaaccaac accatttatt gagcccattt ttagttttct     960
tgttctgtag agtatgcatt gttgcaggtc ttaactgttg tcagggaagt aacgtgttca    1020
acatgattgt aaacgaatac aattctgttg ctaactgtgt aatgatgaga aggataattg    1080
aataatcttt gtgaagtatt actgtctgaa ctgtacgcaa atgctacatt tattctttgt    1140
gttcgtgtaa atatcattat acataaaaat gctgcattgc attcccgtcg tccgttctaa    1200
atcagaactg acgattgctc tggtggctga agctcctgaa agaaaaggaa aaggccgaaa    1260
agaagaaaga gaaaaggagt gacaggaaag ctcccaagca gtgtgagacg tccaaacatt    1320
caaagcacag ccataagaag agaaagcttg aagatgtcat caaagctgag cagggtccca    1380
aaagagtacc caaagaatca gttgagcagt tggagaagag tggactctca gaagagcatg    1440
gagctccttc ttttgtacat acgatacgtg actctcctga gagctcacag gacagcggca    1500
agagacgaaa ggttgtcctg tccagtccta gccaacctaa gaatggtgag actattctct    1560
tgtttttgct attctgattg attttttatt atagaagaaa tcaatatctt gttcaggatt    1620
ttattcatcc caacttgatt ttacaggaaa cattcttcgc ttcaagatta aaagtagtca    1680
agatccccaa tcagctgttc tggagaaacc aagggttctt gagcaaccat tggtccaaca    1740
aatgggatca ggttcatccc tgtcgggcaa gcaaaattca atccatcata agatgaatgt    1800
gagatctacc tctggtcagc ggagggtcaa tggtgactcc caagcagtac aaaaatgttt    1860
gattacagaa tccccggcaa agaccatgca gagacttgtc ccccagcctg cagctaaggt    1920
cacacatcct gttgatcccc agtcagctgt taaggtgcca gttggaagat cgggcctacc    1980
tctgaagtct tcgggaagtg tggacccttc gcctgctaga gttatgagaa gatttgatcc    2040
tccacctgtt aagatgatgt cacagagagt tcaccatcca gcttccatgg tgtcgcagaa    2100
agttgatcct ccgtttccga aggtattaca taaggaaacc ggatctgttg ttcgcctacc    2160
agaagctacc cggcctactg ttcttcaaaa acccaaggac ttgcctgcta tcaagcagca    2220
ggatatcagg acctcttcct caaaagaaga gccctgcttc tctggtagga atgcagaagc    2280
agttcaagtg caagatacta agctctcccg gtcagacatg aagaaaatcc gcaaagctga    2340
gaaaaaagat aagaagttca gagatctgtt tgttacctgg aatccggtat tgatagagaa    2400
tgaaggttca gatcttggtg atgaagactg gctgttcagc agtaaaagga actccgatgc    2460
tatcatggtt caaagcagag ctactgatag ttcagtgccg atccatccaa tggtgcagca    2520
gaagccttct ttacaaccca gggcaacatt tttgccggac cttaatatgt accagctgcc    2580
atatgtcgta ccattttaaa catctggcga ggtagatgag aattagatga gatgttggga    2640
gagagc                                                               2646
<210>38
<211>1347
<212>DNA
<213>Zea mays mays株HuoBai
<220>
<221>CDS
<222>(1)..(1347)
<400>38
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag     96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc    144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga    192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc    240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat    288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca    336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa    384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat    432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg    480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca    528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc    576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg    624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca    672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg    720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga     768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga     816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt     864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa     912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc     960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc    1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc    1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag    1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa    1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac    1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg    1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca    1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt    1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                1347
<210>39
<211>448
<212>PRT
<213>Zea mays mays株HuoBai
<400>39
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>40
<211>262
<212>DNA
<213>Zea mays mays株Makki
<400>40
gaacgaattt gaatcctttg tgatctctac ggcggggtag agcgcggtcg accgtcggcc     60
atgtcgaggt gcttccccta cccgccaccg gggtacgtgc ggaacccagt ggccgtggcc    120
gagccggagt cgaccgctaa ggtttgttga accttcggat ttacacacgc acgtgccaga    180
tcgtttgttc aatctgtagg ttttgcgcgg atctgtggtt tgcgcgtgcg tgatgtgggt    240
attgcccgtg ccttgaaagc ta                                             262
<210>41
<211>2311
<212>DNA
<213>Zea mays mays株Makki
<400>41
tttcgaaaac tggtagcatg gttatcgggg acattgaaag aatggtagaa catcaaattc      60
gattcaaaac tgtgctagat ttgcatattt agtcgcccta aaattacgtg gacgtgggtg     120
atccgaattg gttgttgtat gatggttgga agtgactggc caaatttttt tgtttctcaa     180
agttttcttt gacaaactgt ttgtcgagcg tcaattcgta tttacctgaa tttactaatt     240
cttaatacag tatgtcgtta ttttgggcta agcttgtgta agaagggtcg tttgacattt     300
tgtactgtat tgatgctgtt ttgtgtttct ttgttcggag cagcattcaa tgctcctttt     360
gttgtttgag agaatctgat atttgccatc gtaccgaaag tccgaaacca actattcaaa     420
ttgggatttc atttcttttt ttttctactg tttttagagt tctctttttc gctgctgtgc     480
tcttgtgggt cagtacgtgc atttctcttt ttttcttttt ttttctgatg ttactcttct     540
gttgaccaaa ggagttcaga attattttgg acctgtatat caatagcaac caacaccatt     600
tattgagccc atttttagtt ttcttgttct gtagagtatg cattgttgca ggtcttaact     660
gttgtcaggg aagtaacgtg ttcaacatga ttgtaaacga atacaattct gttgctaact     720
gtgtaatgat gagaaggata attgaataat ctttgtgaag tattactgtc tgaactgtac     780
gcaaatgcta cattcattct ttgtgttcgt gtaaatatca ttatacataa aaatgctgca     840
ttgcattccc gtcgtccgtt ctaaatcaga actgacgatt gctctggtgg ctgaagctcc     900
tgaaagaaaa ggaaaaggcc gaaaagaaga aagagaaaag gagtgacagg aaagctccca     960
agcagtgtga gacgtccaaa cattcaaagc acagccataa gaagagaaag cttgaagatg    1020
tcatcaaagc tgagcagggt cccaaaagag tacccaaaga atcagttgag cagttggaga    1080
agagtggact ctcagaagag catggagctc cttcttttgt acatacgata cgtgactctc    1140
ctgagagctc acaggacagc ggcaagagac gaaaggttgt cctgtccagt cctagccaac    1200
ctaagaatgg tgagactatt ctcttgtttt tgctattctg attgattttt tattatagaa    1260
gaaatcaatc gcttgttcag gattttattc atcccaactt gattttacag gaaacattct    1320
tcgcttcaag attaaaagta gtcaagatcc ccaatcagct gttctggaga aaccaagggt    1380
tcttgagcaa ccattggtcc aacaaatggg atcaggttca tccctgtcgg gcaagcaaaa    1440
ttcaatccat cataagatga atgtgagatc tacctctggt cagcggaggg tcaatggtga    1500
ctcccaagca gtacaaaaat gtttgattac agaatccccg gcaaagacca tgcagagact    1560
tgtcccccag cctgcagcta aggtcacaca tcctgttgat ccccagtcag ctgttaaggt    1620
gccagttgga agatcgggcc tacctctgaa gtcttcrgga agtgtggacc cttcgcctgc    1680
tagagttatg agaagatttg atcctccacc tgttaagatg atgtcacaga gagttcacca    1740
tccagcttcc atggtgtcgc agaaagttga tcctccgttt ccgaaggtat tacataagga    1800
aaccggatct gttgttcgcc taccagaagc tacccggcct actgttcttc aaaaacccaa    1860
ggacttgcct gctatcaagc agcaggatat caggacctct tcctcaaaag aagagccctg    1920
cttctctggt aggaatgcag aagcagttca agtgcaagat actaagctct cccggtcaga    1980
catgaagaaa atccgcaaag ctgagaaaaa agataagaag ttcagagatc tgtttgttac    2040
ctggaatccg gtattgatag agaatgaagg ttcagatctt ggtgatgaag actggctgtt    2100
cagcagtaaa aggaactccg atgctatcat ggttcaaagc agagctactg atagttcagt    2160
gccgatccat ccaatggtgc agcagaagcc ttctttacaa cccagggcaa catttttgcc    2220
ggaccttaat atgtaccagc tgccatatgt cgtaccattt taaacatctg gcgaggtaga    2280
tgagaattag atgagatgtt gggagagagc t                                   2311
<210>42
<211>1347
<212>DNA
<213>Zea mays mays株Makki
<220>
<221>CDS
<222>(1)..(1347)
<220>
<221>misc_feature
<222>(1)..(1347)
<223>位置247处Xaa代表Ser
<400>42
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag     96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc    144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga    192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc    240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                 70                 75                 80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat    288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                 90                   95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca    336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa    384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat    432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg    480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca    528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc    576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg    624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca    672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg    720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcr gga agt gtg gac cct tcg cct gct aga    768
Gly Leu Pro Leu Lys Ser Xaa Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga    816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt    864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
         275                280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa    912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc    960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc    1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc    1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag    1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa    1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac    1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg    1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca    1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt    1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                1347
<210>43
<211>448
<212>PRT
<213>Zea mays mays株Makki
<220>
<22l>misc_feature
<222>(247)..(247)
<223>位置247处Xaa代表Ser
<400>43
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Xaa Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>44
<211>125
<212>DNA
<213>Zea mays mays株Min13
<400>44
ctttgtgatc tctcggcggg gtagagcgcg gtcgaccgtc ggccatgtcg aggtgcttcc     60
cctacccgcc accggggtac gtgcggaacc cagtggccgt ggccgagccg gagtcgaccg    120
ctaag                                                                125
<210>45
<211>198
<212>DNA
<213>Zea mays mays株Min13
<400>45
cttaatacag tatgtcgtta ttttgggcta agcttgtgta agaagggtcg tttgacattt      60
tgtactgtat tgatgctgtt ttgtgtttct ttgttcggag cagcattcaa tgctcctttt     120
gttgtttgag agaatctgat atttgccatc gtaccgaaag tccgaaacca actattcaaa     180
ttgggatttc atttcttt                                                   198
<210>46
<211>1787
<212>DNA
<213>Zea mays mays株Min13
<400>46
ttctgatgtt actcttctgt tgaccaaagg agttcagaat tattttggcc ctgtatatca      60
atagcaacca acaccattta ttgagcccat ttttagtttt cttgttctgt agagtatgca     120
ttgttgcagg tcttaactgt tgtcagggaa gtaacgtgtt caacatgatt gtaaacgaat     180
acaattctgt tgctaactgt gtaatgatga gaaggataat tgaataatct ttgtgaagta     240
ttactgtctg aactgtacgc aaatgctaca ttcattcttt gtgttcgtgt aaatatcatt     300
atacataaaa atgctgcatt gcattcccgt cgtccgttct aaatcagaac tgacgattgc     360
tctggtggct gaagctcctg aaagaaaagg aaaaggccga aaagaagaaa gagaaaagga     420
gtgacaggaa agctcccaag cagtgtgaga cgtccaaaca ttcaaagcac agccataaga     480
agagaaagct tgaagatgtc atcaaagctg agcagggtcc caaaagagta cccaaagaat     540
cagttgagca gttggagaag agtggactct cagaagagca tggagctcct tcttttgtac     600
atacgatacg tgactctcct gagagctcac aggacagcgg caagagacga aaggttgtcc     660
tgtccagtcc tagccaacct aagaatggtg agactattct cttgtttttg ctattctgat     720
tgatttttta ttatagaaga aatcaatcgc ttgttcagga ttttattcat cccaacttga     780
ttttacagga aacattcttc gcttcaagat taaaagtagt caagatcccc aatcagctgt     840
tctggagaaa ccaagggttc ttgagcaacc attggtccaa caaatgggat caggttcatc     900
cctgtcgggc aagcaaaatt caatccatca taagatgaat gtgagatcta cctctggtca     960
gcggagggtc aatggtgact cccaagcagt acaaaaatgt ttgattacag aatccccggc    1020
aaagaccatg cagagacttg tcccccagcc tgcagctaag gtcacacatc ctgttgatcc    1080
ccagtcagct gttaaggtgc cagttggaag atcgggccta cctctgaagt cttcgggaag    1140
tgtggaccct tcgcctgcta gagttatgag aagatttgat cctccacctg ttaagatgat    1200
gtcacagaga gttcaccatc cagcttccat ggtgtcgcag aaagttgatc ctccgtttcc    1260
gaaggtatta cataaggaaa ccggatctgt tgttcgccta ccagaagcta cccggcctac    1320
tgttcttcaa aaacccaagg acttgcctgc tatcaagcag caggatatca ggacctcttc    1380
ctcaaaagaa gagccctgct tctctggtag gaatgcagaa gcagttcaag tgcaggatac    1440
taagctctcc cggtcagaya tgaagaaaat ccgcaaagct gagaaaaaag ataagaagtt    1500
cagagatctg tttgttacct ggaatccggt attgatagag aatgaaggtt cagatcttgg    1560
tgatgaagac tggctgttca gcagtaaaag gaactccgat gctatcatgg ttcaaagcag    1620
agctactgat agttcagtgc cgatccatcc aatggtgcag cagaagcctt ctttacaacc    1680
cagggcaaca tttttgccgg accttaatat gtaccagctg ccatatgtcg taccatttta    1740
aacatctggc gaggtagatg agaattagat gagatgttgg gagagag                  1787
<210>47
<211>1347
<212>DNA
<213>Zea mays mays株Min13
<220>
<221>CDS
<222>(1)..(1347)
<400>47
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca     48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag     96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc    144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga    192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc    240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat    288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca    336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa    384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat     432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg     480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca     528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc     576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg     624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca     672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg     720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga     768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga     816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt     864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa     912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc     960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc    1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg cag gat act aag ctc tcc    1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gay atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag    1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa    1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac    1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg    1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca    1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt    1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                1347
<210>48
<211>448
<212>PRT
<213>Zea mays mays株Min13
<400>48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>49
<211>495
<212>DNA
<213>Zea mays mays株Pira
<400>49
ctcggcgggt agagcgcggt cgacgtcggc atgtcgaggt gcttccccta cccgccaccg      60
gggtacgtgc ggaacccagt ggccgtggcc gagccggagt cgaccgctaa ggttgttgaa     120
ccttcggatt tacacacgca cgtgccagat cgttgttcaa tctgtaggtt ttgcgcggat     180
ctgtggtttg cgcgtgcgtg atgtgggtat tgsccgtgcc ttgaaagcta accgagctga     240
ggaagtgtat ggatcttgtg tagctgcacg aggtcctcca aatcgattgt aaaatttaag     300
ttgtatggsc ggtaggscaa gattgggtta gtccggtttt cgaaaactgg tagcatggtt     360
atcggggaca ttgaaagaat ggtagaacat caaattcgat tcaaaactgt gctagatttg     420
catatttagt cgcccta aa ttacgtggac gtgggtgatc cgaattggtt attgtatgat     480
ggttggaata tgagc                                                      495
<210>50
<211>1768
<212>DNA
<213>Zea mays mays  株  Pira
<400>50
ctgttgacca atggagttca gaattatttt ggccctgtat atcaatagca accaacacca      60
tttattgagc ccatttttag ttttcttgtt ctgtagagta tgcattgttg caggtcttaa     120
ctgttgtcag ggaagtaacg tgttcaacat gattgtaaac gaatacattc tgttgctaac     180
tgtgtaatga tgagaaggat aattgaataa tctttgtgaa gtattactgt ctgaactgta     240
cgcaatgcta cattcattct ttgtgttcgt gtaaatatca ttatacataa aaatgctgct     300
tgcattcccg tcgtccgttc taaatcagaa ctgacgattg ctctggtggc tgaagctcct     360
gaaagaaaag gaaaaagccg aaaagaagaa agagaaaagg agtgacagga aagctcccaa     420
gcagtgtgag acgtccaaac attcaaagca cagccataag aagagaaagc ttgaagatgt     480
catcaaagct gagcagggtc ccaaaagagt acccaaagaa tcagttgagc agttggagaa     540
gagtggactc tcagaagagc atggagctcc ttcttttgta catacgatac gtgactctcc     600
tgagagctca caggacagcg gcaagagacg aaaggttgtc ctgtccagtc ctagccaacc     660
taagaatggt gagactattc tcttgttttt gctattctga ttgatttatt attatagaag     720
aaatcaatca cttgttcagg attttattca tcccaacttg attttacagg aaacattctt     780
cgcttcaaga ttaaaagtag tcaagatccc caatcagctg ttctggagaa accaagggtt     840
cttgagcaac cattggtcca acaaatggga tcaggttcat ccctgtctgg caagcaaaat     900
tcaatccatc ataagatgaa tgtgagatct acctctggtc agcggagggt caatggtgac     960
tcccaagcag tacaaaaatg tttgattaca gaatccccgg caaagaccat gcagagactt    1020
gtcccccagc ctgcagctaa ggtcacacat cctgttgatc cccagtcagc tgttaaggtg    1080
ccagttggaa gatcgggcct acctctgaag tcttcgggaa gtgtggaccc ttcgcctgct    1140
agagttatga gaagatttga tcctccacct gttaagatga tgtcacagag agttcaccat    1200
ccagcttcca tggtgtcgca gaaagttgat cctccgtttc cgaaggtatt acataaggaa    1260
accggatctg ttgttcgcct accagaagct acccggccta ctgttcttca aaaacccaag    1320
gacttgcctg ctatcaagca gcaggagatc aggacctctt yctcaaaaga agagccctgc    1380
ttctctggta ggaatgcaga agcagttcaa gtgcaggata ctaagctctc ccggtcagac    1440
atgaagaaaa tccgcaaagc tgagaaaaaa gataagaagt tcagagatct gtttgttacc    1500
tggaatccgg tattgataga gaatgaaggt tcagatcttg gtgatgaaga ctggctgttc    1560
agcagtaaaa ggaactccga tgctatcatg gttcaaagca gagctactga tagttcagtg    1620
ccgatccatc caatggtgca gcagaagcct tctttacaac ccagggcaac atttttgccg    1680
gaccttaata tgtaccagct gccatatgtc gtaccatttt aaacatctgg cgaggtagat    1740
gagaattaga tgagatgttg ggagagag                                       1768
<210>51
<211>1347
<212>DNA
<213>Zea mays mays  株  Pira
<220>
<221>CDS
<222>(1)..(1347)
<220>
<221>misc_feature
<222>(1)..(1347)
<223>位置329处Xaa代表Ser,或Phe
<400>51
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aaa gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tct ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gag atc agg acc tct tyc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Glu Ile Arg Thr Ser Xaa Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg cag gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>52
<211>448
<212>PRT
<213>Zea mays mays  株  Pira
<220>
<221>misc_feature
<222>(329)..(329)
<223>位置329处Xaa代表Ser,或Phe
<400>52
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Glu Ile Arg Thr Ser Xaa Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>53
<211>212
<212>DNA
<213>Zea mays mays  株  Sari
<400>53
gcgcggtcga ccgtcggcat gtcgaggtgc ttcccctacc cgccaccggg gtacgtgcgg     60
aacccagtgg ccgtggccga gccggagtcg accgctaagg tttgttgaac cttcggattt    120
acacacgcac gtgccagatc gtttgttcaa tctgtaggtt ttgcgcggat ctgtggtttg    180
cgcgtgcgtg atgtgggtat tgcccgtgcc tt                                  212
<210>54
<211>1803
<212>DNA
<213>Zea mays mays  株  Sari
<400>54
ttttttcctt tttttttctg atgttactct tctgttgacc aaaggagttc agaattattt     60
tggccctgta tatcaatagc aaccaacacc atttattgag cccattttta gttttcttgt    120
tctgtagagt atgcattgtt gcaggtctta actgttgtca gggaagtaac gtgttcaaca    180
tgattgtaaa cgaatacaat tctgttgcta actgtgtaat gatgagaagg ataattgaat    240
aatctttgtg aagtattact gtctgaactg tacgcaaatg ctacattcat tctttgtgtt    300
cgtgtaaata tcattataca taaaaatgct gcattgcatt cccgtcgtcc gttctaaatc    360
agaactgacg attgctctgg tggctgaagc tcctgaaaga aaaggaaaag gccgaaaaga    420
agaaagagaa aaggagtgac aggaaagctc ccaagcagtg tgagacgtcc aaacattcaa    480
agcacagcca taagaagaga aagcttgaag atgtcatcaa agctgagcag ggtcccaaaa    540
gagtacccaa agaatcagtt gagcagttgg agaagagtgg actctcagaa gagcatggag    600
ctccttcttt tgtacatacg atacgtgact ctcctgagag ctcacaggac agcggcaaga    660
gacgaaaggt tgtcctgtcc agtcctagcc aacctaagaa tggtgagact attctcttgt    720
ttttgctatt ctgattgatt ttttattata gaagaaatca atcgcttgtt caggatttta    780
ttcatcccaa cttgatttta caggaaacat tcttcgcttc aagattaaaa gtagtcaaga    840
tccccaatca gctgttctgg agaaaccaag ggttcttgag caaccattgg tccaacaaat    900
gggatcaggt tcatccctgt cgggcaagca aaattcaatc catcataaga tgaatgtgag    960
atctacctct ggtcagcgga gggtcaatgg tgactcccaa gcagtacaaa aatgtttgat    1020
tacagaatcc ccggcaaaga ccatgcagag acttgtcccc cagcctgcag ctaaggtcac    1080
acatcctgtt gatccccagt cagctgttaw ggtgccagtt ggaagatcgg gcctacctct    1140
gaagtcttcg ggaagtgtgg acccttcgcc tgctagagtt atgagaagat ttgatcctcc    1200
acctgttaag atgatgtcac agagagttca ccatccagct tccatggtgt cgcagaaagt    1260
tgatcctccg tttccgaagg tattacataa ggaaaccgga tctgttgttc gcctaccaga    1320
agctacccgg cctactgttc ttcaaaaacc caaggacttg cctgctatca agcagcagga    1380
tatcaggacc tcttcctcaa aagaagagcc ctgcttctct ggtaggaatg cagaagcagt    1440
tcaagtgcar gatactaagc tctcccggtc agayatgaag aaaatccgca aagctgagaa    1500
aaaagataag aagttcagag atctgtttgt tacctggaat ccggtattga tagagaatga    1560
aggttcagat cttggtgatg aagactggct gttcagcagt aaaaggaact ccgatgctat    1620
catggttcaa agcagagcta ctgatagttc agtgccgatc catccaatgg tgcagcagaa    1680
gccttcttta caacccaggg caacattttt gccggacctt aatatgtacc agctgccata    1740
tgtcgtacca ttttaaacat ctggcgaggt agatgagaat tagatgagat gttgggagag    1800
agc                                                                  1803
<210>55
<211>1347
<212>DNA
<213>Zea mays mays  株  Sari
<220>
<221>CDS
<222>(1)..(1347)
<220>
<221>misc_feature
<222>(1)..(1347)
<223>位置234处Xaa代表Lys或Met
<400>55
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt awg gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Xaa Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg car gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gay atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>56
<211>448
<212>PRT
<213>Zea mays mays  株  Sari
<220>
<221>misc_feature
<222>(234)..(234)
<223>位置234处Xaa代表Lys,或Met
<400>56
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Xaa Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>57
<211>305
<212>DNA
<213>Zea mays mays  株  Smena
<400>57
gattgatttc gagcgattcg attccttgtg atctctcggc ggggtagagc gcggtcgacc      60
gtcggccatg tcgaggtgct tcccctaccc gccaccgggg tacgtgcgga acccagtggc     120
cgtggccgag ccggagtcga ccgctaaggt ttgttgaacc ttcggattta cacacgcacg     180
tgccagatcg tttgttcaat atgtaggttt tgcgcggatc tgtggtttgc gcgtgcgtga     240
tgtgggtatt gcccgtgcct aagctaaccg agctgaggaa gtgtatggat cttgtgtagc     300
tgcac                                                                 305
<210>58
<211>2208
<212>DNA
<213>Zea mays mays  株  Smena
<400>58
tttagtcgcc ctaaaaatac gtggacgtgg gtgatccgaa ttggttgttg tatgatggtt      60
ggaatatgag ccatctagtg cttccgtgac tggccaaatt tttttgtttc tcaaagtttt     120
ctttgaaaaa ctgtttgtcg agcgtcaatt cgtatttacc tgaatttact aattcttaat     180
acagtatgtc gttattttgg gctaagcttg tgtaagaagg gtcgtttgac attttgtact     240
gtattaatgc tgttttgtgt ttctttgttc ggagcagcat tcaatgctcc ttttgttgtt     300
tgagagaatc tgatatttgc catcgtaccg aaagtccgaa accaactatt caaattggga     360
tttcatttct ttttttttct actgttttta gagttctctt tttcgctgct gtgctcttgt     420
gggtcagtac gtgcatttct ctcttttttt cttttttttt ctgatgttac tcttctgttg     480
accaaaggag ttcagaatta ttttggccct gtatatcaat ttgcaaccaa caccatttat     540
tgagcccatt tttagttttc ttgttctgta gagttatgca ttgtttcagg tcttaactgt     600
tgtcagggaa gtaacgtgtt caacatgatt gtaaacgaat acaattctgt tgctaactgt     660
gtaatgatga gaaggataat tgaatagtct ttgtgaagta ttactgtctg aactgtacgc     720
aaatgctaca ttcattctgt gttcatgtaa atatcattat acataaaaat gctgcattgc     780
attcccgtcg tccgttctaa atcagaactg acgattgctc tggtggctga agctcctgaa     840
agaaaaggaa aaggccgaaa agaagaaaga gaaaaggagt gacaggaaag atcccaagca     900
gtgtgagacg tccaaacact caaagcacag ccataagaag agaaagcttg aagatgtcat     960
caaagctgag cagggtccca aaagagtacc caaagaatca gttgagcagt tggagaagag    1020
tggactctca gaagagcatg gagctccttc ttttgtacat acgatacggg actctcctga    1080
gagctcacag gacagcggca agagacgaaa ggttgtcctg tccagtccta gccaacctaa    1140
gaatggtgag actattctct tgtttttgct attctgattg atttattatt atagaagaaa    1200
tcaatcactt gttcaggatt ttattcatcc caacttgatt ttacaggaaa cattcttcgc    1260
ttcaagatta aaagtagtca agatccccaa tcagctgttc tggagaaacc aagggttctt    1320
gagcaaccat tggtccaaca aatgggatca ggttcatccc tgtcgggcaa gcaaaattca    1380
atccatcata agatgaatgt gagatctacc tctggtcagc ggagggtcaa tggtgactcc    1440
caagcagtac aaaaatgttt gattacagaa tccccggcaa agaccatgca gagacttgtc    1500
ccccagcctg cagctaaggt cacacatcct gttgatcccc agtcagctgt taaggtgcca    1560
gttggaagat cgggcctacc tctgaagtct tcaggaagtg tggacccttc gcctgctaga    1620
gttatgagaa gatttgatcc tccacctgtt aagatgatgt cacagagagt tcaccatcca    1680
gcttccatgg tgtcgcagaa agttgatcct ccgtttccga aggtattaca taaggaaacc    1740
ggatctgttg ttcgcctacc agaagctacc cggcctactg ttcttcaaaa acccaaggac    1800
ttgccttcta tcaagcagca ggagatcagg acctcttcct caaaagaaga gccctgcttc    1860
tctggtagga atgcagaagc tgttcaagtg caggatacta agctctcccg gtcagatatg    1920
aagaaaatcc gcaaagctga gaaaaaagat aagaagttca gagatctgtt tgttacctgg    1980
aatccggtat tgatagagaa tgaaggttca gatcttggtg atgaagactg gctgttcagc    2040
agtaaaagga actccgatgc tatcatggtt caaagcagag ctactgatag ttcagtgccg    2100
atccatccaa tggtgcagca gaagccttct ttacaaccca gggcaacatt tttgccggac    2160
cttaatatgt accagctgcc atatgtcgta ccattttaaa catctggc                 2208
<210>59
<211>1640
<212>DNA
<213>Zea mays parviglumis  株  Wilkes
<400>59
tcagggaagt aacgtgttca acatgattgt aaacgaatac cattctgttg ctaactgtgt      60
aatgatgaga aggataattg aataatcttt gtgaagtatt actgtctgaa ctgtacgcct     120
aatgctacat tcattctttg tgttcgtgta aatatcatta tacataaatg ctgcattgca     180
ttcccgtcgt ccgttctaaa tcagaactga cgattgctct ggtggctgaa gctcctgaaa     240
gaaaaggaaa aggccgaaaa gaagaaagag aaaaggagtg acaggaaagc tcccaagcag     300
tgtgagacgt ccaaacattc aaagcacagc cataagaaga gaaagcttga agatgtcatc     360
aaagctgagc agggtcccaa aagagtaccc aaagaatcag ttgagcagtt ggagaagagt     420
ggactctcag aagagcatgg agctccttct tttgtacata cgatacgtga ctctcctgag     480
agctcacagg acagcggcaa gagacgaaag gttgtcctgt ccagtcctag ccaacctaag     540
aatggtgaga ctattctctt gtttttgcta ttctgattga ttttttatta tagaagaaat     600
caatcgcttg ttcaggattt tattcatccc aacttgattt tacaggaaac attcttcgct     660
tcaagattaa aagtagtcaa gatccccaat cagctgttct ggagaaacca agggttcttg     720
agcaaccatt ggtccaacaa atgggatcag gttcatccct gtcgggcaag caaaattcaa     780
tccatcataa gatgaatgtg agatctacct ctggtcagcg gagggtcaat ggtgactccc     840
aagcagtaca aaaatgtttg attacagaat ccccggcaaa gaccatgcag agacttgtcc     900
cccagcctgc agctaaggtc acacatcctg ttgatcccca gtcagctgtt aaggtgccag     960
ttggaagatc gggcctacct ctgaagtctt cgggaagtgt ggacccttcg cctgctagag    1020
ttatgagaag atttgatcct ccacctgtta agatgatgtc acagagagtt caccatccag    1080
cttccatggt gtcgcagaaa gttgatcctc cgtttccgaa ggtattacat aaggaaaccg    1140
gatctgttgt tcgcctacca gaagctaccc ggcctactgt tcttcaaaaa cccaaggact    1200
tgcctgctat caagcagcag gatatcagga cctcttcctc aaaagaagag ccctgcttct    1260
ctggtaggaa tgcagaagca gttcaagtgc aagatactaa gctctcccgg tcagacatga    1320
agaaaatccg caaagctgag aaaaaagata agaagttcag agatctgttt gttacctgga    1380
atccggtatt gatagagaat gaaggttcag atcttggtga tgaagactgg ctgttcagca    1440
gtaaaaggaa ctccgatgct atcatggttc aaagcagagc tactgatagt tcagtgccga    1500
tccatccaat ggtgcagcag aagccttctt tacaacccag ggcaacattt ttgccggacc    1560
ttaatatgta ccagctgcca tatgtcgtac cattttaaac atctggcgag gtagatgaga    1620
attagatgag atgttgggag                                                1640
<210>60
<211>1347
<212>DNA
<213>Zea mays mays  株  Smena
<220>
<221>CDS
<222>(1)..(1347)
<400>60
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gat ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Asp Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cac tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgg gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tca gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct tct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ser Ile
305                 310                 315                 320
aag cag cag gag atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Glu Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gct gtt caa gtg cag gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gat atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>61
<211>448
<212>PRT
<213>Zea mays mays  株  Smena
<400>61
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Asp Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ser Ile
305                 310                 315                 320
Lys Gln Gln Glu Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>62
<211>893
<212>DNA
<213>Zea mays mays  株  W22
<400>62
atgtcgaggt gcttccccta cccgccaccg gggtacgtgc ggaacccagt ggccgtggcc      60
gagccggagt cgaccgctaa ggtttgttga accttcggat ttacacacgc acgtgccaga     120
tcgtttgttc aatctgtagg ttttgcgcgg atctgtggtt tgcgcgtgcg tgatgtggcc     180
ctgtgccttg aaagctaacc gagctgagga agtgtatgga tcttgtgtag ctgcacgagg     240
tcctccaaat cgattgtaaa atttaagttg tatggccggt aggccaagat tgggttagtc     300
cggttttcga aaactggtag catggttatc ggggacattg aaagaatggt agaacatcaa     360
attcgattca aaactgtgct agatttgcat atttagtcgc cctaaaatta cgtggacgtg     420
ggtgatccga attggttgtt gtatgatggt tggaagtgac tggccaaatt tttttgtttc     480
tcaaagtttt ctttgaaaaa ctgtttgtcg agcgtcaatt cgtatttacc tgaatttact     540
aattcttaat acagtatttc gttattttcg gctaagcttg tgtaagaagg gtcgtttgac     600
attttgtact gtattaatgc tgttttgtgt ttctttgttc ggagcagcat tcaatgctcc     660
ttttgttgtt tgagagaatc tgatatttgc catcgtaccg aaagtccgaa accaactatt     720
caaattggga tttcatttct tttttctact gtttttagag ttctcttttt cgctgctgtg     780
ctcttgtggg tcagtacgtg catttctctt tttttttctg atgttactct tctgttgacc     840
aaaggagttc agaattattt tggccctgta tatcaatagc aaccaacacc att            893
<210>63
<211>1411
<212>DNA
<213>Zea mays mays  株  W22
<400>63
ctcctgaaag aaaaggaaaa ggccgaaaag aagaaagaga aaaggagtga caggaaagct      60
cccaagcagt gtgagacgtc caaacattca aagcacagcc ataagaagag aaagcttgaa     120
gatgtcatca aagctgagca gggtcccaaa agagtaccca aagaatcagt tgagcagttg     180
gagaagagtg gactctcaga agagcatgga gctccttctt ttgtacatac gatacgtgac     240
tctcctgaga gctcacagga cagcggcaag agacgaaagg ttgtcctgtc cagtcctagc     300
caacctaaga atggtgagac tattctcttg tttttgctat tctgattgat tttttattat     360
agaagaaatc aatcgcttgt tcaggatttt attcatccca acttgatttt acaggaaaca     420
ttcttcgctt caagattaaa agtagtcaag acccccaatc agctgttctg gagaaaccaa     480
gggttcttga gcaaccattg gtccaacaaa tgggatcagg ttcatccccg tcgggcaagc     540
aaaattcaat ccatcataag atgaatgtga gatctacctc tggtcagcgg agggtcgatg     600
gtgactccca agcagtacaa aaatgtttga ttacagaatc cccggcaaag accatgcaga     660
gacttgtccc ccagcctgca gctaaggtca cacatcctgt tgatccccag tcagctgtta     720
aggtgccagt tggaagatcg ggcctacctc tgaagtcttc gggaagtgtg gacccttcgc     780
ctgctagagt tatgagaaga tttgatcctc cacctgttaa gatgatgtca cagagagttc     840
accatccagc ttccatggtg tcgcagaaag ttgatcctcc gtttccgaag gtattacata     900
aggaaaccgg atctgttgtt cgcctaccag aagctacccg gcctactgtt cttcaaaaac     960
ccaaggactt gcctgctatc aagcagcagg atatcaggac ctcttcctca aaagaagagc    1020
cctgcttctc tggtaggaat gcagaagcag ttcaagtgca agatactaag ctctcccggt    1080
cagacatgaa gaaaatccgc aaagctgaga aaaaagataa gaagttcaga gatctgtttg    1140
ttacctggaa tccggtattg atagagaatg aaggttcaga tcttggtgat gaagactggc    1200
tgttcagcag taaaaggaac tccgatgcta tcatggttca aagcagagct actgatagtt    1260
cagtgccgat ccatccaatg gtgcagcaga agccttcttt acaacccagg gcaacatttt    1320
tgccggacct taatatgtac cagctgccat atgtcgtacc attttaaaca tctggcgagg    1380
tagatagaat tagatagatg ttgggagaga g                                   1411
<210>64
<211>1347
<212>DNA
<213>Zea mays mays  株  W22
<220>
<221>CDS
<222>(1)..(1347)
<400>64
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gac       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ccg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Pro Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
gat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asp Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>65
<211>448
<212>PRT
<213>Zea mays mays  株  W22
<400>65
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Pro Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asp Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>66
<211>2644
<212>DNA
<213>Zea mays parviglumis  株  Benz
<400>66
atgtcgaggt gcttccccta cccgccaccg gggtacgtgc ggaacccagt ggccgtggcc      60
gagccggagt cgaccgctaa ggtttgttga accttcggat ttacacacgc acgtgccaga     120
tcgtttgttc aatctgtagg ttttgcgcgg atctgtggtt tgcgcgtgcg tgatgtgggt     180
attgcccgtg ccttgaaagc taaccgagct gaggaagtgt atggatcttg tgtagctgca     240
cgaggtcctc caaatcgatt gtaaaattta agttgtatgg ccggtaggcc aagattgggt     300
tattccggtt ttcgaaaact ggtagcatgg ttatcgggga cattgaaaga atggtagaac     360
atcaaattcg attcaaaact gtgctagatt tgcatattta gtcgccctaa aattacgtgg     420
acgtgggtga tccgaattgg ttgttgtatg atggttggaa gtgactggcc aaattttttt     480
gtttctcaaa gttttctttg acaaactgtt tgtcgagcgt caattcgtat ttacctgaat     540
ttactaattc ttaatacagt atgtcgttat tttgggctaa gcttgtgtaa gaagggtcgt     600
ttgacatttt gtactgtatt gatgctgttt tgtgtttctt tgttcggagc agcattcaat     660
gctccttttg ttgtttgaga gaatctgata tttgccatcg taccgaaagt ccgaaaccaa     720
ctattcaaat tgggatttca tttctttttt ttctactgtt tttagagttc tctttttcgc     780
tgctgtgctc ttgtgggtca gtacgtgcat ttctcttttt ttcttttttt ttctgatgtt     840
actcttctgt tgaccaaagg agttcagaat tattttggcc ctgtatatca atagcaacca     900
acaccattta ttgagcccat ttttagtttt cttgttctgt agagtatgca ttgttgcagg     960
tcttaactgt tgtcagggaa gtaacgtgtt caacatgatt gtaaacgaat acaattctgt    1020
tgctaactgt gtaatgatga gaaggataat tgaataatct ttgtgaagta ttactgtctg    1080
aactgtacgc aaatgctaca ttcattcttt gtgttcgtgt aaatatcatt atacataaaa    1140
atgctgcatt gcattcccgt cgtccgttct aaatcagaac tgacgattgc tctggtggct    1200
gaagctcctg aaagaaaagg aaaaggccga aaagaagaaa gagaaaagga gtgacaggaa    1260
agctcccaag cagtgtgaga cgtccaaaca ttcaaagcac agccataaga agagaaagct    1320
tgaagatgtc atcaaagctg agcagggtcc caaaagagta cccaaagaat cagttgagca    1380
gttggagaag agtggactct cagaagagca tggagctcct tcttttgtac atacgatacg    1440
tgactctcct gagagctcac aggacagcgg caagagacga aaggttgtcc tgtccagtcc    1500
tagccaacct aagaatggtg agactattct cttgtttttg ctattctgat tgatttttta    1560
ttatagaaga aatcaatcgc ttgttcagga ttttattcat cccaacttga ttttacagga    1620
aacattcttc gcttcaagat taaaagtagt caagatcccc aatcagctgt tctggagaaa    1680
ccaagggttc ttgagcaacc attggtccaa caaatgggat caggttcatc cctgtcgggc    1740
aagcaaaatt caatccatca taagatgaat gtgagatcta cctctggtca gcggagggtc    1800
aatggtgact cccaagcagt acaaaaatgt ttgattacag aatccccggc aaagaccatg    1860
cagagacttg tcccccagcc tgcagctaag gtcacacatc ctgttgatcc ccagtcagct    1920
gttaaggtgc cagttggaag atcgggccta cctctgaagt cttcgggaag tgtggaccct    1980
tcgcctgcta gagttatgag aagatttgat cctccacctg ttaagatgat gtcacagaga    2040
gttcaccatc cagcttccat ggtgtcgcag aaagttgatc ctccgtttcc gaaggtatta    2100
cataaggaaa ccggatctgt tgttcgccta ccagaagcta cccggcctac tgttcttcaa    2160
aaacccaagg acttgcctgc tatcaagcag caggatatca ggacctcttc ctcaaaagaa    2220
gagccctgct tctctggtag gaatgcagaa gcagttcaag tgcaagatac taagctctcc    2280
cggtcagaca tgaagaaaat ccgcaaagct gagaaaaaag ataagaagtt cagagatctg    2340
tttgttacct ggaatccggt attgatagag aatgaaggtt cagatcttgg tgatgaagac    2400
tggctgttca gcagtaaaag gaactccgat gctatcatgg ttcaaagcag agctactgat    2460
agttcagtgc cgatccatcc aatggtgcag cagaagcctt ctttacaacc cagggcaaca    2520
tttttgccgg accttaatat gtaccagctg ccatatgtcg taccatttta aacatctggc    2580
gaggtagatg agaattagat gagatgttgg gagagagctg tgtgaacagt aggccgggta    2640
gctt                                                                 2644
<210>67
<211>1347
<212>DNA
<213>Zea mays parviglumis  株  Benz
<220>
<221>CDS
<222>(1)..(1347)
<400>67
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu A la Val Gln Val Gln Asp Thr Lys Leu Ser
            340                  345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>68
<211>448
<212>PRT
<213>Zea mays parviglumis  株  Benz
<400>68
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>69
<211>586
<212>DNA
<213>Zea mays parviglumis  株  BK4
<400>69
acgtcggcca tgtcgaggtg cttcccctac ccgccaccgg ggtacgtgcg gaacccagtg      60
gccgtggccg agccggagtc gaccgctaag gtttgttgaa ccttcggatt tacacacgca     120
cgtgccagat cgtttgttca atctgtaggt tttgcgcgga tctgtggttt gcgcgtgcgt     180
gatgtggccc gtgccttgaa agctaaccga gctgaggaag tgtatggatc ttgtgtagct     240
gcacgaggtc ctccaaatcg attgtaaaat ttaagttgta tggccggtag gccaagattg     300
ggttagtccg gttttcgaaa actggtagca tggttatcgg ggacattgaa agaatggtag     360
aacatcaaat tcgattcaaa actgtgctag atttgcatat ttagtcgccc taaaattacg     420
tggacgtggg tgatccgaat tggttgttgt atgatggttg gaagtgactg gccaaatttt     480
ttgtttctca aagttttctt tgaaaaactg tttgtcgagc gtcaattcgt atttacctga     540
atttactaat tcttaataca gtatttcgtt attttcggct aagctt                    586
<210>70
<211>1775
<212>DNA
<213>Zea mays parviglumis  株  BK4
<400>70
tcttctgttg accaaaggag ttcagaatta ttttggccct gtatatcaat agcaaccaac      60
accatttatt gatcccattt ttagttttct tgttctgtag agtatgcatt gttgcaggtc     120
ttaactgttg tcagggaagt aacgtgttca acatgattgt aaacgaatac aattctgttg     180
ctaactgtgt aatgatgaga aggataattg aataatcttt gtgaagtatt actgtctgaa     240
ctgtacgcaa atgctacatt cattctttgt gttcgtgtaa atatcattat acataaaaat     300
gctgcattgc attcccgtcg tccgttctaa tcagaactga cgattgctct ggtggctgaa     360
gctcctgaaa gaaaaggaaa aggccgaaaa gaagaaagag aaaaggagtg acaggaaagc     420
tcccaagcag tgtgagacgt ccaaacattc aaagcacagc cataagaaga gaaagcttga     480
agatgtcatc aaagctgagc agggtcccaa aagagtaccc aaagaatcag ttgagcagtt     540
ggagaagagt ggactctcag aagagcatgg agctccttct tttgtacata cgatacgtga     600
ctctcctgag agctcacagg acagcggcaa gagacgaaag gttgtcctgt ccagtcctag     660
ccaacctaag aatggtgaga ctattctctt gtttttgcta ttctgattga ttttttatta     720
tagaagaaat caatcgcttg ttcaggattt tattcatccc aacttgattt tacaggaaac     780
attcttcgct tcaagattaa aagtagtcaa gacccccaat cagctgttct ggagaaacca     840
agggttcttg agcaaccatt ggtccaacaa atgggatcag gttcatcccc gtcgggcaag     900
caaaattcaa tccatcataa gatgaatgtg agatctacct ctggtcagcg gagggtcgat     960
ggtgactccc aagcagtaca aaaatgtttg attacagaat ccccggcaaa gaccatgcag    1020
agacttgtcc cccagcctgc agctaaggtc acacatcctg ttgatcccca gtcagctgtt    1080
aaggtgccag ttggaagatc gggcctacct ctgaagtctt cgggaagtgt ggacccttcg    1140
cctgctagag ttatgagaag atttgatcct ccacctgtta agatgatgtc acagagagtt    1200
caccatccag cttccatggt gtcgcagaaa gttgatcctc cgtttccgaa ggtattacat    1260
aaggaaaccg gatctgttgt tcgcctacca gaagctaccc ggcctactgt tcttcaaaaa    1320
cccaaggact tgcctgctat caagcagcag gatatcagga cctcttcctc aaaagaagag    1380
ccctgcttct ctggtaggaa tgcagaagca gttcaagtgc aagatactaa gctctcccgg    1440
tcagacatga agaaaatccg caaagctgag aaaaaagata agaagttcag agatctgttt    1500
gttacctgga atccggtatt gatagagaat gaaggttcag atcttggtga tgaagactgg    1560
ctgttcagca gtaaaaggaa ctccgatgct atcatggttc aaagcagagc tactgatagt    1620
tcagtgccga tccatccaat ggtgcagcag aagccttctt tacaacccag ggcaacattt    1680
ttgccggacc ttaatatgta ccagctgcca tatgtcgtac cattttaaac atctggcgag    1740
gtagatgaga attagatgag atgttgggag agagc                               1775
<210>71
<211>1347
<212>DNA
<213>Zea mays parviglumis  株  BK4
<220>
<221>CDS
<222>(1)..(1347)
<400>71
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gac       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ccg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Pro Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
gat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asp Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>72
<211>448
<212>PRT
<213>Zea mays parviglumis  株  BK4
<400>72
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Pro Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asp Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>73
<211>305
<212>DNA
<213>Zea mays parviglumis  株  IA19
<400>73
gattgatttc gagcgattcg actccttgtg atctctacgg cggggtagag cgcggtcgac      60
cgtcggccat gtcgaggtgc ttcccctacc cgccaccggg gtacgtgcgg aacccagtgg     120
ccgtggccga gccggagtcg accgctaagg tttgttgaac cttcggattt acacacgcac     180
gtgccagatc gtttgttcaa tctgtaggtt ttgcgcggat ctgtggtttg cgcgtgcgtg     240
atgtgggtat tgcccgtgcc ttgaaagcta accgagctga ggaagtgtat ggatcttgtg     300
tagct                                                                 305
<210>74
<211>1309
<212>DNA
<213>Zea mays parviglumis  株  IA19
<400>74
tcaaagcaca gccataagaa gagaaagctt gaagatgtca tcaaagctga gcaggttccc      60
aaaagagtac ccaaagaatc agttgagcag ttggagaaga gtggactctc agaagagcat     120
ggagctcctt cttttgtaca tacgatacgt gactctcctg agagctcaca ggacagcggc     180
aagagacgaa aggttgtcct gtccagtcct agccaaccta agaatggtga gactattctc     240
ttgtttttgc tattctgatt gattttttat tatagaagaa atcaatcgct tgttcaggat     300
tttattcatc ccaacttgat tttacaggaa acattcttcg cttcaagatt aaaagtagtc     360
aagatcccca atcagctgtt ctggagaaac caagggttct tgagcaacca ttggtccaac     420
aaatgggatc aggttcatcc ctgtcgggca agcaaaattc aatccatcat aagatgaatg     480
tgagatctec ctctggtcag cggagggtca atggtgactc ccaagcagta caaaaatgtt     540
tgattacaga atccccggca aagaccatgc agagacttgt cccccagcct gcagctaagg     600
tcacacatcc tgttgatccc cagtcagctg ttaaggtgcc agttggaaga tcgggcctac     660
ctctgaagtc ttcgggaagt gtggaccctt cgcctgctag agttatgaga agatttgatc     720
ctccacctgt taagatgatg tcacagagag ttcaccatcc agcttccatg gtgtcgcaga     780
aagttgatcc tccgtttccg aaggtattac ataaggaaac cggatctgtt gttcgcctac     840
cagaagctac ccggcctact gttcttcaaa aacccaagga cttgcctgct atcaagcagc     900
aggakatcag gacctcttcc tcaaaagaag agccctgctt ctctggtagg aatgcagaag     960
cagttcaagt gcaggatact aagctctccc ggtcagacat gaagaaaatc cgcaaagctg    1020
agaaaaaaga taagaagttc agagatctgt ttgttacctg gaatccggta ttgatagaga    1080
atgaaggttc agatcttggt gatgaagact ggctgttcag cagtaaaagg aactccgatg    1140
ctatcatggt tcaaagcaga gctactgata gttcagtgcc gatccatcca atggtgcagc    1200
agaagccttc tttacaaccc agggcaacat ttttgccgga ccttaatatg taccagctgc    1260
catatgtcgt accattttaa acatctgtcg aggtagatga gaattagat                1309
<210>75
<211>1347
<212>DNA
<213>Zea mays parviglumis  株  IA19
<220>
<221>CDS
<222>(1)..(1332)
<220>
<221>misc_feature
<222>(82)..(168)
<223>n=A,C,T,或G
<400>75
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Set Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag nnn nnn nnn nnn nnn        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Xaa Xaa Xaa Xaa Xaa
            20                  25                  30
nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn       144
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
        35                  40                  45
nnn nnn nnn nnn nnn nnn nnn nnn tca aag cac agc cat aag aag aga       192
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag gtt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Val Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gak atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Xaa Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg cag gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtcgtaccat tttaa     1347
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr
        435                 440
<210>76
<211>444
<212>PRT
<213>Zea mays parviglumis  株  IA19
<220>
<221>misc_feature
<222>(28)..(28)
<223>位置28处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(29)..(29)
<223>位置29处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(30)..(30)
<223>位置30处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(31)..(31)
<223>位置31处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(32)..(32)
<223>位置32处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(33)..(33)
<223>位置33处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(34)..(34)
<223>位置34处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(35)..(35)
<223>位置35处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(36)..(36)
<223>位置36处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(37)..(37)
<223>位置37处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(38)..(38)
<223>位置38处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(39)..(39)
<223>位置39处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,GIy,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(40)..(40)
<223>位置40处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<223>位置41处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(42)..(42)
<223>位置42处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(43)..(43)
<223>位置43处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(44)..(44)
<223>位置44处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(45)..(45)
<223>位置45处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(46)..(46)
<223>位置46处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(47)..(47)
<223>位置47处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(48)..(48)
<223>位置48处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(49)..(49)
<223>位置49处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(50)..(50)
<223>位置50处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(51)..(51)
<223>位置51处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(52)..(52)
<223>位置52处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(53)..(53)
<223>位置53处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(54)..(54)
<223>位置54处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(55)..(55)
<223>位置55处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(56)..(56)
<223>位置56处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(324)..(324)
<223>位置324处Xaa代表Glu,或Asp.
<400>76
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Xaa Xaa Xaa Xaa Xaa
            20                  25                   30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
        35                  40                  45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Val Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Xaa Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr
        435                 440
<210>77
<211>86
<212>DNA
<213>Zea mays parviglumis  株  Wilkes
<400>77
ctctcggcgg ggtagagcgc ggtcgaccgt cggccatgtc gaggtgcttc ccctacccgc      60
caccggggta cgtgcggaac ccagtg                                           86
<210>78
<211>1347
<212>DNA
<213>Zea mays parviglumis  株  Wilkes
<220>
<221>CDS
<222>(1)..(1347)
<220>
<221>misc_feature
<222>(52)..(81)
<223>N=A,C,G,或T
<400>78
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg nnn nnn nnn nnn nnn nnn nnn nnn nnn nnn ctc ctg aaa gaa aag        96
Val Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag tct tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg aga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg ttt       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gat atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg caa gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gac atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Set Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct tta caa ccc agg gca aca      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>79
<211>448
<212>PRT
<213>Zea mays parviglumis  株  Wilkes
<220>
<221>misc_feature
<222>(18)..(18)
<223>位置18处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(19)..(19)
<222>位置19处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(20)..(20)
<223>位置20处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(21)..(21)
<223>位置21处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(22)..(22)
<223>位置22处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(23)..(23)
<223>位置23处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(24)..(24)
<223>位置24处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(25)..(25)
<223>位置25处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(26)..(26)
<223>位置26处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<220>
<221>misc_feature
<222>(27)..(27)
<223>位置27处Xaa代表                     Lys,Asn,Arg,Ser,Thr,Ile,
     Met,Glu,Asp,Gly,Ala,Val,Gln,His,Pro,Leu,Tyr,Trp,Cys,
     或Phe.
<400>79
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Ser Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Arg Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Phe
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Asp Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>80
<211>225
<212>DNA
<213>Zea diploperennis
<400>80
agcgcggtcg accgtcggcc atgtcgaggt gcttccccta cccgccaccg gggtacgtgc      60
ggaacccagt ggccgtggcc gagccggagt cgaccgctaa ggtttgttga accttcggat     120
ttacacacgc acgtgccaga tcgtttgttc aatctgtagg ttttgcgcgg atctgtggtt     180
tgcgcgtgcg tgatgtgggt attgcccgtg ccttgaaagc taacc                     225
<210>81
<211>1672
<212>DNA
<213>Zea diploperennis
<400>81
agcccatttt tagttttatt gttctgtaga gtatgcattg ttgcaggtct taactgttgt      60
cagggaagta acgtgttcaa catgattgta aacgaataca attctgttgc taactgtgta     120
atgatgagaa ggataattga ataatctttg tgaagtatta ctgtctgaac tgtacgcaaa     180
tgctacattc attctttgtg ttcgtgtaaa tatcattata cataaaaatg ctgcattgca     240
ttcccgtcgt ccgttctaaa tcagaactga cgattgctct ggtggctgaa gctcctgaaa     300
gaaaaggaaa aggccgaaaa gaagaaagag aaaaggagtg acaggaaagc tcccaagcag     360
tgtgagacgt ccaaacactc aaagcacagc cataagaaga gaaagcttga agatgtcatc     420
aaagctgagc agggtcccaa aagagtaccc aaagaatcag ttgagcagtt ggagaagagt     480
ggactctcag aagagcatgg agctccttct tttgtacata cgatacgtga ctctcctgag     540
agctcacagg acagcggcaa gagacgaaag gttgtcctgt ccagtcctag ccaacctaag     600
aatggtgaga ctattctctt gtttttgcta ttctgattga ttttttatta tagaagaaat     660
caatcacttg ttcaggattt tattcatccc aacttgattt tacaggaaac attcttcgct     720
tcaagattaa aagtagtcaa gatccccaat cagctgttct ggagaaacca agggttcttg     780
agcaaccatt ggtccaacaa atgggatcag gttcatccct gtcgggcaag caaaattcaa     840
tccatcataa gatgaatgtg agatctacct ctggtcagcg gagggtcaat ggtgactcgc     900
aagcagtaca aaaatgtttg attacagaat ccccggcaaa gaccatgcag agacttgtcc     960
cccagcctgc agctaaggtc acacatcctg ttgatcccca gtcagctgtt aaggtgccag    1020
ttggaaggtc gggcctacct ctcaagtttt cgggaagtat ggacccttcg cctgctagag    1080
ttatgggaag atttgatcct ccacctgtta agatgatgtc acagagagtt caccatccag    1140
cttccatggt gtcgcagaaa gttgatcctc cgttaccgaa ggtattacat aaggaaaccg    1200
gatctgttgt tcgcctacca gaagctaccc ggcctactgt tcttcaaaaa cccaaggact    1260
tgcctgctat caagcagcag cagatcagga cctcttcctc aaaagaagag ccctgcttct    1320
ctggtaggaa tgcagaagca gttcaagtgc atgatactaa gctctcccgg tcagatatga    1380
agaaaatccg caaagctgag aaaaaagata agaagttcag agatctgttt gttacctgga    1440
atccggtatt gatagagaat gaaggttcag atcttggtga tgaagactgg ctgttcagca    1500
gtaaaaggaa ctccgatgct atcatggttc aaagcagagc tactgatagt tcagtgccga    1560
tccatccaat kgtgcagcag aaaccttctt tacaacccag ggcaacattt ttgccggacc    1620
ttaatatgta ccagctgcca tatgtcgtac cattttaaac atctgtcgag gt            1672
<210>82
<211>1347
<212>DNA
<213>Zea diploperennis
<220>
<221>CDS
<222>(1)..(1347)
<220>
<221>misc_feature
<222>(1)..(1347)
<223>位置420处Xaa代表Met或Ile
<400>82
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ctg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa agg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cac tca aag cac agc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct gag cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat acg ata cgt gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt agt caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gag caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gac tcg caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga agg tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctc aag ttt tcg gga agt atg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Phe Ser Gly Ser Met Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg gga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Gly Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg tta       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Leu
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag cag atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Gln Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg cat gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val His Asp Thr Lys Leu Ser
            340                 345                 350
cgg tca gat atg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gta ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gtt caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atk gtg cag cag aaa cct tct tta caa ccc agg gca aca      1296
Ile His Pro Xaa Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atg tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>83
<211>448
<212>PRT
<213>Zea diploperennis
<220>
<221>misc_feature
<222>(420)..(420)
<223>位置420处Xaa代表Met,或Ile
<400>83
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Leu Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ser His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Glu Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Thr Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Ser Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Glu Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Asp Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Phe Ser Gly Ser Met Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Gly Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Leu
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Gln Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val His Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Met Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Val Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Xaa Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Met Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>84
<211>2423
<212>DNA
<213>Zea luxurians
<400>84
ggccatgtcg aggtgcttcc cctacccgcc accggggtac gtgcggaacc cagtggccgt      60
ggccgagccg gagtcgaccg ctaaggtttg ttgaaccttc ggatttacac acgcacgtgc     120
cagatcgttt ggtcaatctg ttggttttgc gcggatctgt ggtttgcgcg tgcgtgatgt     180
gggtattgcc cgtgccttga aagctaaccg agatgaggaa gtgtatggat cttgtttagc     240
tgcacgaggt cctccaaatc gattgaaaaa tttaagttgg atggccggta ggccaagatt     300
gggttagtcc ggtttttgat aactggtacc atggttatcg gggacattga acagaacggt     360
agaacatcaa attcgattca aaactgtgct agatttgcac atttagtcgc cctaagatta     420
cgtggacgtg ggtggtccga attggttgtt gttgtatgat ggttggaata tgagccattt     480
agtgcttccg tgactggcca aatatttttg tttctcaaat ttttctttga aaaactgttt     540
gtcgagcgtc aattcttaat acagtatgtc gttattttgg gctaagcttg tgaaacaagg     600
gtcgtttgac atttgtactg tattaacctg atgttactct tctggttgac caaaggagtt     660
ttagaattat tttggtcctg taaatcaata gcaactaaca ccatctattg tgcccatttt     720
tagttttgta tagttttgta tgcagtgttg caggtcttaa ctgttgtcag gaaagtaacg     780
tgttcacatg attgtaaacg aatacaattc tgttgctaac tgtgtaatga tgagaacgat     840
aattgaataa tctttgtgaa gtattactgt ctgaactgta cacaaatgct acattcattc     900
tttgtgttcg tgtaaatgtc attatacata aaaaatgctg cattgcattc ccgtcgtccg     960
ttctaaatca gaactgacga ttgctctggt ggctgaagct cccgaaagaa aaggaaaagg    1020
ccgaaaagaa gaaagagaaa cggagtgaca ggaaagctcc caagcagtgt gagacgtcca    1080
aacattcaaa gcacatccat aagaagagaa agcttgaaga tgtcatcaaa gctgggcagg    1140
gtcccaaaag agtacccaaa gaatcagttg agcagttgga gaagagtgga ctctcagaag    1200
agcatggagc tccttctttt gtacataaga tacgcgactc tcctgagagc tcacaggaca    1260
gcggcaagag acgaaaggtt gtcctgtcca gtcctagcca acctaagaat ggtgagacta    1320
ttctcttgtt tttgctattc tgattgattt tttattatag aagaaatcaa tcacttgttc    1380
cggattttat tcatcccaac ttgacatttt acaggaaaca ttcttcgctt caagattaaa    1440
agtaatcaag atccccaatc agctgttctg gagaaaccaa gggttcttga ccaaccattg    1500
gtccaacaaa tgggatcagg ttcatccctg tcgggcaagc aaaattcaat ccatcataag    1560
atgaatgtga gatctacctc tggtcagcgg agggtcaatg gtgaatccca agcagtacaa    1620
aaatgtttga ttacagaatc cccggcaaag accatgcaga gacttgtccc ccagcctgca    1680
gctaaggtca cacatcctgt tgatccccag tcagctgtta aggtgccagt tggaagatcg    1740
ggcctacctc tgaagttttc gggaagtgtg gacccttcgc ctgctagagt tatgggaaga    1800
tttgatcctc cacctgttaa gatgatgtca cagagagttc accatccagc ttccatggtg    1860
tcgcagaaag ttgatcctcc gttaccgaag gtattacata aggaaaccgg atctgttgtt    1920
cgcctaccag aagctacccg gcctactgtt cttcaaaaac ccaaggactt gcctgctatc    1980
aagcagcagg agatcaggac ctcttcctca aaagaagagc cctgcttctc tggtaggaat    2040
gcagaagcag ttcaagtgca ggatactaag ctctcccggt cagatgtgaa gaaaatccgc    2100
aaagctgaga aaaaagataa gaagttcaga gatctgtttg ttacctggaa tccggtgttg    2160
atagagaatg aaggttcaga tcttggtgat gaagactggc tgttcagcag taaaaggaac    2220
tccgatgcta tcatggctca aagcagagct actgatagtt cagtgccgat ccatccaatg    2280
gtgcagcaga agccttcttt gcaacccagg gcaacgtttt tgccggacct taatatctac    2340
cagctgccat atgtcgtacc attttaaaca tctgtcgagg tagatgagaa ttagatgaga    2400
tgttgggaga gagctgtgtg aac                                            2423
<210>85
<211>1347
<212>DNA
<213>Zea luxurians
<220>
<221>CDS
<222>(1)..(1347)
<400>85
atg tcg agg tgc ttc ccc tac ccg cca ccg ggg tac gtg cgg aac cca        48
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
gtg gcc gtg gcc gag ccg gag tcg acc gct aag ctc ccg aaa gaa aag        96
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Pro Lys Glu Lys
            20                  25                  30
gaa aag gcc gaa aag aag aaa gag aaa cgg agt gac agg aaa gct ccc       144
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
aag cag tgt gag acg tcc aaa cat tca aag cac atc cat aag aag aga       192
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ile His Lys Lys Arg
    50                  55                  60
aag ctt gaa gat gtc atc aaa gct ggg cag ggt ccc aaa aga gta ccc       240
Lys Leu Glu Asp Val Ile Lys Ala Gly Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
aaa gaa tca gtt gag cag ttg gag aag agt gga ctc tca gaa gag cat       288
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
gga gct cct tct ttt gta cat aag ata cgc gac tct cct gag agc tca       336
Gly Ala Pro Ser Phe Val His Lys Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
cag gac agc ggc aag aga cga aag gtt gtc ctg tcc agt cct agc caa       384
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
cct aag aat gga aac att ctt cgc ttc aag att aaa agt aat caa gat       432
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Asn Gln Asp
    130                 135                 140
ccc caa tca gct gtt ctg gag aaa cca agg gtt ctt gac caa cca ttg       480
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Asp Gln Pro Leu
145                 150                 155                 160
gtc caa caa atg gga tca ggt tca tcc ctg tcg ggc aag caa aat tca       528
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
atc cat cat aag atg aat gtg aga tct acc tct ggt cag cgg agg gtc       576
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
aat ggt gaa tcc caa gca gta caa aaa tgt ttg att aca gaa tcc ccg       624
Asn Gly Glu Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
gca aag acc atg cag aga ctt gtc ccc cag cct gca gct aag gtc aca       672
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
cat cct gtt gat ccc cag tca gct gtt aag gtg cca gtt gga aga tcg       720
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
ggc cta cct ctg aag ttt tcg gga agt gtg gac cct tcg cct gct aga       768
Gly Leu Pro Leu Lys Phe Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
gtt atg gga aga ttt gat cct cca cct gtt aag atg atg tca cag aga       816
Val Met Gly Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
gtt cac cat cca gct tcc atg gtg tcg cag aaa gtt gat cct ccg tta       864
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Leu
        275                 280                 285
ccg aag gta tta cat aag gaa acc gga tct gtt gtt cgc cta cca gaa       912
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
gct acc cgg cct act gtt ctt caa aaa ccc aag gac ttg cct gct atc       960
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
aag cag cag gag atc agg acc tct tcc tca aaa gaa gag ccc tgc ttc      1008
Lys Gln Gln Glu Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
tct ggt agg aat gca gaa gca gtt caa gtg cag gat act aag ctc tcc      1056
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                  345                 350
cgg tca gat gtg aag aaa atc cgc aaa gct gag aaa aaa gat aag aag      1104
Arg Ser Asp Val Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
ttc aga gat ctg ttt gtt acc tgg aat ccg gtg ttg ata gag aat gaa      1152
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
ggt tca gat ctt ggt gat gaa gac tgg ctg ttc agc agt aaa agg aac      1200
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
tcc gat gct atc atg gct caa agc aga gct act gat agt tca gtg ccg      1248
Ser Asp Ala Ile Met Ala Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
atc cat cca atg gtg cag cag aag cct tct ttg caa ccc agg gca acg      1296
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
ttt ttg ccg gac ctt aat atc tac cag ctg cca tat gtc gta cca ttt      1344
Phe Leu Pro Asp Leu Asn Ile Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
taa                                                                  1347
<210>86
<211>448
<212>PRT
<213>Zea luxurians
<400>86
Met Ser Arg Cys Phe Pro Tyr Pro Pro Pro Gly Tyr Val Arg Asn Pro
1               5                   10                  15
Val Ala Val Ala Glu Pro Glu Ser Thr Ala Lys Leu Pro Lys Glu Lys
            20                  25                  30
Glu Lys Ala Glu Lys Lys Lys Glu Lys Arg Ser Asp Arg Lys Ala Pro
        35                  40                  45
Lys Gln Cys Glu Thr Ser Lys His Ser Lys His Ile His Lys Lys Arg
    50                  55                  60
Lys Leu Glu Asp Val Ile Lys Ala Gly Gln Gly Pro Lys Arg Val Pro
65                  70                  75                  80
Lys Glu Ser Val Glu Gln Leu Glu Lys Ser Gly Leu Ser Glu Glu His
                85                  90                  95
Gly Ala Pro Ser Phe Val His Lys Ile Arg Asp Ser Pro Glu Ser Ser
            100                 105                 110
Gln Asp Ser Gly Lys Arg Arg Lys Val Val Leu Ser Ser Pro Ser Gln
        115                 120                 125
Pro Lys Asn Gly Asn Ile Leu Arg Phe Lys Ile Lys Ser Asn Gln Asp
    130                 135                 140
Pro Gln Ser Ala Val Leu Glu Lys Pro Arg Val Leu Asp Gln Pro Leu
145                 150                 155                 160
Val Gln Gln Met Gly Ser Gly Ser Ser Leu Ser Gly Lys Gln Asn Ser
                165                 170                 175
Ile His His Lys Met Asn Val Arg Ser Thr Ser Gly Gln Arg Arg Val
            180                 185                 190
Asn Gly Glu Ser Gln Ala Val Gln Lys Cys Leu Ile Thr Glu Ser Pro
        195                 200                 205
Ala Lys Thr Met Gln Arg Leu Val Pro Gln Pro Ala Ala Lys Val Thr
    210                 215                 220
His Pro Val Asp Pro Gln Ser Ala Val Lys Val Pro Val Gly Arg Ser
225                 230                 235                 240
Gly Leu Pro Leu Lys Phe Ser Gly Ser Val Asp Pro Ser Pro Ala Arg
                245                 250                 255
Val Met Gly Arg Phe Asp Pro Pro Pro Val Lys Met Met Ser Gln Arg
            260                 265                 270
Val His His Pro Ala Ser Met Val Ser Gln Lys Val Asp Pro Pro Leu
        275                 280                 285
Pro Lys Val Leu His Lys Glu Thr Gly Ser Val Val Arg Leu Pro Glu
    290                 295                 300
Ala Thr Arg Pro Thr Val Leu Gln Lys Pro Lys Asp Leu Pro Ala Ile
305                 310                 315                 320
Lys Gln Gln Glu Ile Arg Thr Ser Ser Ser Lys Glu Glu Pro Cys Phe
                325                 330                 335
Ser Gly Arg Asn Ala Glu Ala Val Gln Val Gln Asp Thr Lys Leu Ser
            340                 345                 350
Arg Ser Asp Val Lys Lys Ile Arg Lys Ala Glu Lys Lys Asp Lys Lys
        355                 360                 365
Phe Arg Asp Leu Phe Val Thr Trp Asn Pro Val Leu Ile Glu Asn Glu
    370                 375                 380
Gly Ser Asp Leu Gly Asp Glu Asp Trp Leu Phe Ser Ser Lys Arg Asn
385                 390                 395                 400
Ser Asp Ala Ile Met Ala Gln Ser Arg Ala Thr Asp Ser Ser Val Pro
                405                 410                 415
Ile His Pro Met Val Gln Gln Lys Pro Ser Leu Gln Pro Arg Ala Thr
            420                 425                 430
Phe Leu Pro Asp Leu Asn Ile Tyr Gln Leu Pro Tyr Val Val Pro Phe
        435                 440                 445
<210>87
<211>21
<212>DNA
<213>人工序列引物
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物
<400>87
caattctctg agatgccttg g                                                21
<210>88
<211>21
<212>DNA
<213>人工序列引物
<220>
<223>引物
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物
<400>88
caattctctg agatgccttg g                                                21
<210>89
<211>1402
<212>DNA
<213>Oryza rufipogon
<220>
<221>misc_feature
<222>(1)..(1402)
<223>n=a,c,t,或g
<400>89
gatgagctca cgcggggcgg cgcggctcga gctcgagccg cctatgaggg catcaaagga      60
aagggttggc cttcgtcctg cagagatgtt ggccaatgtt ggtccttcac cctccaaggc     120
aaaacagatt gtcaatcctg cagctgctaa ggttacacaa agagttgatc ctccacctgc     180
caaggcatct cagagaattg atcctctgtt gccatccaag gttcatatag atgctactca     240
atcttttacg aaggtctccc agacagagat caagccggaa gtacagcccc caattccgaa     300
ggtgcctgtg gctatgccta ccatcaatcg tcagcagatt gacacctcgc agcccaaaga     360
agagccttgc tcctctggca ggaatgctga agctgcttca gtatcagtag agaagcagtc     420
caagtcagat cgcaaaaaga gccgcaaggc tgagaagaaa gagaagaagt tcaaagattt     480
atttgttacc tgggatcctc cgtctatgga aatggatgat atggatcttg gggaccagga     540
ttggctgctt ggtagtacga ggaaacctga tgctggcatt ggcaactgca gagaaattgt     600
tgatccactt tacttctcaa tcagcagagc agttctcatt gcagcctang gcgattcatt     660
tacccagacc ttcatgtcta tcagttgcca tatgtggttc cattctaggt ttgtgtagtg     720
agatggagta gtgagaagta agagatgttg ggaagagagc tgtgtgggtc tgggagatta     780
tggttccctg gcacagtttc ccagctttgt tcccagcgtt cttgtttcac ggttgctact     840
gtccaacttc ctgtgtnggt tttttggcgc cgctattgng gcttggactc cccattgatn     900
cctcacacaa ggaaattcga gtagttcaag cgctatttga ttaccggcga accacccaaa     960
gggggggggc cggtacccca cgacctttgg ttccccctca actagaaggg gtnatattgt    1020
cgcgccgggg gtaacaatgn gcacanaacc agtcacggtg nngaaagntt ttatccggtc    1080
cccaaaatat ntcccnccca ncaaatntna atacccgggg gcactacagt tnttataaac    1140
cngtggggcn ctacaanngt ggacgatctc acaaattata atcatatttg tagtatntgc    1200
cgangttcgc aaccgtcana cacnatcagt tgtcgacgcn acgattattt ttcnacagcc    1260
gngctacaca ancgaccgcc gaaangnatg tataggatga ngtacatacn atacctgact    1320
caanacgtac canacatcag catcntgcgc gnntgatgan tactcaggaa gnagcgtccc    1380
tacntccgat tgaaatngtg ac                                             1402
<210>90
<211>1341
<212>DNA
<213>0ryza rufipogon  株  IRCG105491
<400>90
atgtcgaggt gcttccccta cccgccgccg gggtacgtgc gaaacccagt ggtggccgtg      60
gccgcggccg aagcgcaggc gaccactaag ctccagaaag aaagggaaaa ggccgaaaag     120
aagaaagaga aaaagagtga caggaaagct cttccacatg gtgagatatc caagcattca     180
aagcgaaccc acaagaagag aaaacatgaa gacatcaata atgctgatca gaagtcccgg     240
aaggtttcct ccatggaacc tggtgagcaa ttggagaaga gtggactctc agaagagcat     300
ggagctcctt gctttactca gacagtgcat ggctctccag agagttcaca ggacagcagc     360
aagagaagaa aggttgtgtt acccagtcct agccaagcta agaatggtaa catccttcga     420
ataaagataa gaagagatca agattcttca gcttcccttt cggagaaatc taatgttgta     480
caaacaccag ttcatcaaat gggatcagtt tcatctctgc caagtaagaa aaactcaatg     540
caaccacaca acaccgaaat gatggtgaga acagcatcaa cccagcagca aagcatcaaa     600
ggtgattttc aagcagtact gaaacaaggt atgccaaccc cagcaaaagt catgccaaga     660
gtcgatgttc ctccatctat gagggcatca aaggaaaggg ttggccttcg tcctgcagag     720
atgttggcca atgttggtcc ttcaccatcc aaggcaaaac agattgtcaa tcctgcagct     780
gctaaggtta cacaaagagt tgatcctcca cctgccaagg catctcagag aattgatcct     840
ctgttgccat ccaaggttca tatagatgct actcgatctt ttacgaaggt ctcccagaca     900
gagatcaagc cggaagtaca gcccccaatt ccgaaggtgc ctgtggctat gcctaccatc     960
aatcgtcagc agattgacac ctcgcagccc aaagaagagc cttgctcctc tggcaggaat    1020
gctgaagctg cttcagtatc agtagagaag cagtccaagt cagatcgcaa aaagagccgc    1080
aaggctgaga agaaagagaa gaagttcaaa gatttatttg ttacctggga tcctccgtct    1140
atggaaatgg atgatatgga tcttggggac caggattggc tgcttggtag tacgaggaaa    1200
cctgatgctg gcattggcaa ctgcagagaa attgttgatc cacttacttc tcaatcagca    1260
gagcagttct cattgcagcc tagggcgatt catttaccag accttcatgt ctatcagttg    1320
ccatatgtgg ttccattcta g                                              1341
<210>91
<211>2157
<212>DNA
<213>Oryza sativa cv.Nipponbare
<400>91
tcgaccagat cggtcgccaa tcttttagtg gctgaccgtg gaaagaggat attactgact      60
tcggtttgct aattttggtt gtgccgttga atctgaaata accagaatag tcatggggaa     120
aaaagtctga tctggaaggt tcgaattaca tttctatata ttgttgtgct cccagacgat     180
ggttgcaaga aatcactcat gctggataaa attgtggatg taagagtctg cagtcgttaa     240
aatctggaaa cagcacattt tgccgtagta aatttgaatc catgttgctg tctcgttatt     300
ggtgtgttac gagtaacctg tgtgttgtta tctccgcttg gactagattc caagtaatcc     360
agtgccttca tgacctgcaa attctatgcc tatgaagtaa catgaacagt ttgtatgtat     420
gtattctgtt gatgcatact tgcattattt gtgagatgta catgttgtgg taaaattttg     480
cattcaccat atagaaatag taactgacta tccttgttta gttcgaaaac tactgcaggt     540
ttagttattc tctgttgcca agagtgcttg ttatgattgt aagggttaca gttctgtgac     600
taaccatgta acaaatatat taaggattat caaattattc tatgtgaagt gtccgtgccc     660
taattgtgtt atcttctgta actgatagca caacatttgt ttcctgctgt gtgcttgtgt     720
aaattggtac ttcatcatta ctatatattt caaagaaaat tctgcattgc attcccgtcg     780
tccgttctaa atcagaactg acgattgctc tggtggctga agctccagaa agaaagggaa     840
aaggctgaaa agaagaaaga gaaaaggagt gacaggaaag ctcttccaca tggtgagata     900
tccaagcatt caaagcgaac ccaccacaag aagagaaaac atgaagacat caataatgct     960
gatcagaagt cccggaaggt ttcctccatg gaacctggtg agcaattgga gaagagtgga    1020
ctctcagaag agcatggagc tccttgcttt actcagacag agcatggctc tccagagagt    1080
tcacaggaca gcagcaagag aagaaaggtt gtgttaccca gtcctagcca agctaagaat    1140
ggtgaggccc tttcttgcat ttgtcttctt ttagctggtg atgttgaatt ggtttgactt    1200
atcctgaatt atcatcttgc aggtaacatc cttcgaataa agataagaag agatcaagat    1260
tcttcagctt ccctttcgga gaaatctaat gttgtacaaa caccagttca tcaaatggga    1320
tcagtttcat ctctgccaag taagaaaaac tcaatgcaac cacacaacac cgaaatgatg    1380
gtgagaacag catcaaccca gcagcaaagc atcaaaggtg attttcaagc agtaccgaaa    1440
caaggtatgc caaccccagc aaaagtcatg ccaagagtcg atgttcctcc atctatgagg    1500
gcatcaaagg aaaggattgg ccttcgtcct gcagagatgt tggccaatgt tggtccttca    1560
ccctccaagg caaaacagat tgtcaatcct gcagctgcta aggttacaca aagagttgat    1620
cctccacctg ccaaggcatc tcagagaatt gatcctctgt tgccatccaa ggttcatata    1680
gatgctactc gatcttttac gaaggtctcc cagacagaga tcaagccgga agtacagccc    1740
ccaattctga aggtgcctgt ggctatgcct accatcaatc gtcagcagat tgacacctcg    1800
cagcccaaag aagagccttg ctcctctggc aggaatgctg aagctgcttc agtatcagta    1860
gagaagcagt ccaagtcaga tcgcaaaaag agccgcaagg ctgagaagaa agagaagaag    1920
ttcaaagatt tatttgttac ctgggatcct ccgtctatgg aaatggatga tatggatctc    1980
ggggaccagg attggctgct tgatagtacg aggaaacctg atgctggcat tggcaactgc    2040
agagaaattg ttgatccact tacttctcaa tcagcagagc agttctcatt gcagcctagg    2100
gcgattcatt taccagacct tcatgtctat cagttgccat atgtggttcc attctag       2157
<210>92
<211>1259
<212>DNA
<213>Oryza rufipogon  株  5948
<400>92
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgacataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcaccgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttga     1259
<210>93
<211>868
<212>DNA
<213>Oryza rufipogon  株  5948
<400>93
attctttgac aaggctgcca tcatctcatc tgatgatgcc aagagtgact cctttacaaa      60
tccgtggagg ctatgcactg tcacccaggt ggaagaactg aaaattctaa tcagaatgtt     120
tcccatttgg gccactacta ttatattcaa cgcggtgtat gctcagaact cttctatgtt     180
catagagcag ggaatggttc ttgacaagcg agttggatct ttcattgtcc ctcctgcatc     240
cctctcaact tttgatgtca tcagtgtcat catctggatt ccgttttatg accgtgtgct     300
tgtgccaata gctagaaagt tcactggaag ggagaagggt ttctctgagt tacagcggat     360
tggaatcgga ttagccctct ccatccttgc aatgctatct gcagctcttg ttgagttgag     420
gcgtttagag atcgccagat ctgaaggtct tattcatgag gatgttgctg ttccgatgag     480
cattctttgg caaataccgc agtatttctt ggttggcgct gctgaggtct ttgctgccat     540
aggtcaggtt gagttcttct acaatgaagc ccctgatgcc atgaggagtt tgtgtagtgc     600
atttgcgctt gtaacagtct cactggggag ctatttaagc tcaatcatat taaccttggt     660
gtcatatttt acaactcaag gaggggatcc tggatggatc ccagataacc tgaatgaagg     720
ccacctagat cggttctttt cattgattgc tgggatcaac tttgtgaatt tactggtttt     780
cactggttgt gcaatgagat acagatacaa gaaagcatga tgactgtact catggtaagg     840
tcagtttgtg taagtaataa cagatttt                                        868
<210>94
<211>1659
<212>DNA
<213>Oryza rufipogon  株  5948
<220>
<221>CDS
<222>(1)..(1659)
<400>94
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc acc gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cag aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt tat gac cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Tyr Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta gag atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>95
<211>552
<212>PRT
<213>0ryza rufipogon  株  5948
<400>95
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Tyr Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>96
<211>1230
<212>DNA
<213>Oryza rufipogon  株  5949
<400>96
cactggaaat tggcgtgcat gttttttcat cctaggtaat ttgttaaaga tgcatagcat      60
atcccataaa actttggcac agtacttgaa ggaattcctt gtttcttcgc actagtgagt     120
aatgcttcta tatggttttg aatcgtacaa tcctgtattt accttttgcc aaaatatttt     180
ggtgacatac aacacaaaag aaatgctggt cgaagtacca gatagcatac tttacagatc     240
aattgaaaaa tgctgtgcac atttttatct gttctgcaat gagtagcttt gaagtttcag     300
aaatgctagt ttggtgacag gggatgaatg ctgtgagaga ctggcctatt atggtattgc     360
aaagaaccta gttacttatc tgaaaacaaa tcttcatcaa ggcaaccttg aagctgcaag     420
aaatgttaca acttggcagg ggacatgcta cctaacaccc ctcattggtg ccctcctagc     480
agattcttac tggggaaagt actggactat tgctgctttc tcagcaattt attttattgt     540
aagtacaagc ctattgctat agaagatatt agatattacc tacttcggtg cacttgcacc     600
atgtgctgaa ctgatctttt caaaataatt tcatatctga aacatggata atttctgaac     660
tttttaactg aagggtctgg ttgctttgac gctgtcagca tcagttccag ctctgcagcc     720
gcctaaatgt tcaggatcta tttgtccaga agcaagctta ctccagtatg gtgtattttt     780
ctctggcctc tatatgatag ccctcgggac tggaggcatc aaaccttgtg tatcatcctt     840
tggagctgat caatttgatg acagtgatcc agcagacaga gtaaagaagg gctccttctt     900
caattggttt tacttctgta taaatatcgg tgcatttgta tcaggcaccg ttatagtttg     960
gatacaagat aactcaggtt gggggatagg atttgccatt cctactatat ttatggcatt    1020
agcgattgca agtttctttg ttgcctcaaa tatgtacaga tttcagaaac ctggtggaag    1080
ccctcttaca agagtgtgtc aggttgttgt tgcagcattc cgtaagtggc acactgaagt    1140
gccacatgat acatctcttt tatatgaggt tgatggccag acttcagcga ttgagggaag    1200
ccggaagctg gagcacacaa gtgaacttga                                     1230
<210>97
<211>1225
<212>DNA
<213>Oryza rufipogon  株  5949
<400>97
ataaaactga tacactacct tcttgtactg ttccattttg ggattggtgg aaattaaata      60
ctaaatgcaa caaaaagaat atggataagg ccatacagca gaacgctagt agtatattag     120
tagtttgtcc atggcatgca attcttataa gtctacttat aattactatt actggtgcct     180
ataattaata tgggaccatt agaggtatat ttgtataatg actgaaaata tcagggtagc     240
acaagcaata tatgtcagta ggtggcttgc tttacagaca catttctttt actttttttt     300
agacaatata atatattgtg ttttcttgtc tgactgaaat tactttttgt tatacagatt     360
ctttgacaag gctgccatca tctcatctga tgatgccaag agtgactcct ttacaaatcc     420
gtggaggcta tgcactgtca cccaggtgga agaactgaaa attctaatca gaatgtttcc     480
catttgggcc actactatta tattcaacgc ggtgtatgct cagaactctt ctatgttcat     540
agagcaggga atggttcttg acaagcgagt tggatctttc attgtccctc ctgcatccct     600
ctcaactttt gatgtcatca gtgtcatcat ctggattccg ttttatgacc gtgtgcttgt     660
gccaatagct agaaagttca ctggaaggga gaagggtttc tctgagttac agcggattgg     720
aatcggatta gccctctcca tccttgcaat gctatctgca gctcttgttg agttgaggcg     780
tttagagatc gccagatctg aaggtcttat tcatgaggat gttgctgttc cgatgagcat     840
tctttggcaa ataccgcagt atttcttggt tggcgctgct gaggtctttg ctgccatagg     900
tcaggttgag ttcttctaca atgaagcccc tgatgccatg aggagtttgt gtagtgcatt     960
tgcgcttgta acagtctcac tggggagcta tttaagctca atcatattaa ccttggtgtc    1020
atattttaca actcaaggag gggatcctgg atggatccca gataacctga atgaaggcca    1080
cctagatcgg ttcttttcat tgattgctgg gatcaacttt gtgaatttac tggttttcac    1140
tggttgtgca atgagataca gatacaagaa agcatgatga ctgtactcat ggtaaggtca    1200
gtttgtgtaa gtaataacag atttt                                          1225
<210>98
<211>1632
<212>DNA
<213>Oryza rufipogon  株  5949
<220>
<221>CDS
<222>(1)..(1632)
<220>
<221>misc_feature
<222>(1)..(2)
<223>N=A,T,C,或G
<400>98
nnc act gga aat tgg cgt gca tgt ttt ttc atc cta ggg gat gaa tgc        48
Xaa Thr Gly Asn Trp Arg Ala Cys Phe Phe Ile Leu Gly Asp Glu Cys
1               5                   10                  15
tgt gag aga ctg gcc tat tat ggt att gca aag aac cta gtt act tat        96
Cys Glu Arg Leu Ala Tyr Tyr Gly Ile Ala Lys Asn Leu Val Thr Tyr
            20                  25                  30
ctg aaa aca aat ctt cat caa ggc aac ctt gaa gct gca aga aat gtt       144
Leu Lys Thr Asn Leu His Gln Gly Asn Leu Glu Ala Ala Arg Asn Val
        35                  40                  45
aca act tgg cag ggg aca tgc tac cta aca ccc ctc att ggt gcc ctc       192
Thr Thr Trp Gln Gly Thr Cys Tyr Leu Thr Pro Leu Ile Gly Ala Leu
    50                  55                  60
cta gca gat tct tac tgg gga aag tac tgg act att gct gct ttc tca       240
Leu Ala Asp Ser Tyr Trp Gly Lys Tyr Trp Thr Ile Ala Ala Phe Ser
65                  70                  75                  80
gca att tat ttt att ggt ctg gtt gct ttg acg ctg tca gca tca gtt       288
Ala Ile Tyr Phe Ile Gly Leu Val Ala Leu Thr Leu Ser Ala Ser Val
                85                  90                  95
cca gct ctg cag ccg cct aaa tgt tca gga tct att tgt cca gaa gca       336
Pro Ala Leu Gln Pro Pro Lys Cys Ser Gly Ser Ile Cys Pro Glu Ala
            100                 105                 110
agc tta ctc cag tat ggt gta ttt ttc tct ggc ctc tat atg ata gcc       384
Ser Leu Leu Gln Tyr Gly Val Phe Phe Ser Gly Leu Tyr Met Ile Ala
        115                 120                 125
ctc ggg act gga ggc atc aaa cct tgt gta tca tcc ttt gga gct gat       432
Leu Gly Thr Gly Gly Ile Lys Pro Cys Val Ser Ser Phe Gly Ala Asp
    130                 135                 140
caa ttt gat gac agt gat cca gca gac aga gta aag aag ggc tcc ttc       480
Gln Phe Asp Asp Ser Asp Pro Ala Asp Arg Val Lys Lys Gly Ser Phe
145                 150                 155                 160
ttc aat tgg ttt tac ttc tgt ata aat atc ggt gca ttt gta tca ggc       528
Phe Asn Trp Phe Tyr Phe Cys Ile Asn Ile Gly Ala Phe Val Ser Gly
                165                 170                 175
acc gtt ata gtt tgg ata caa gat aac tca ggt tgg ggg ata gga ttt       576
Thr Val Ile Val Trp Ile Gln Asp Asn Ser Gly Trp Gly Ile Gly Phe
            180                 185                 190
gcc att cct act ata ttt atg gca tta gcg att gca agt ttc ttt gtt       624
Ala Ile Pro Thr Ile Phe Met Ala Leu Ala Ile Ala Ser Phe Phe Val         195                 200                 205
gcc tca aat atg tac aga ttt cag aaa cct ggt gga agc cct ctt aca       672
Ala Ser Asn Met Tyr Arg Phe Gln Lys Pro Gly Gly Ser Pro Leu Thr
    210                 215                 220
aga gtg tgt cag gtt gtt gtt gca gca ttc cgt aag tgg cac act gaa       720
Arg Val Cys Gln Val Val Val Ala Ala Phe Arg Lys Trp His Thr Glu
225                 230                 235                 240
gtg cca cat gat aca tct ctt tta tat gag gtt gat ggc cag act tca       768
Val Pro His Asp Thr Ser Leu Leu Tyr Glu Val Asp Gly Gln Thr Ser
                245                 250                 255
gcg att gag gga agc cgg aag ctg gag cac aca agt gaa ctt gaa ttc       816
Ala Ile Glu Gly Ser Arg Lys Leu Glu His Thr Ser Glu Leu Glu Phe
            260                 265                 270
ttt gac aag gct gcc atc atc tca tct gat gat gcc aag agt gac tcc       864
Phe Asp Lys Ala Ala Ile Ile Ser Ser Asp Asp Ala Lys Ser Asp Ser
        275                 280                 285
ttt aca aat ccg tgg agg cta tgc act gtc acc cag gtg gaa gaa ctg       912
Phe Thr Asn Pro Trp Arg Leu Cys Thr Val Thr Gln Val Glu Glu Leu
    290                 295                 300
aaa att cta atc aga atg ttt ccc att tgg gcc act act att ata ttc       960
Lys Ile Leu Ile Arg Met Phe Pro Ile Trp Ala Thr Thr Ile Ile Phe
305                 310                 315                 320
aac gcg gtg tat gct cag aac tct tct atg ttc ata gag cag gga atg      1008
Asn Ala Val Tyr Ala Gln Asn Ser Ser Met Phe Ile Glu Gln Gly Met
                325                 330                 335
gtt ctt gac aag cga gtt gga tct ttc att gtc cct cct gca tcc ctc      1056
Val Leu Asp Lys Arg Val Gly Ser Phe Ile Val Pro Pro Ala Ser Leu
            340                 345                 350
tca act ttt gat gtc atc agt gtc atc atc tgg att ccg ttt tat gac      1104
Ser Thr Phe Asp Val Ile Ser Val Ile Ile Trp Ile Pro Phe Tyr Asp
        355                 360                 365
cgt gtg ctt gtg cca ata gct aga aag ttc act gga agg gag aag ggt      1152
Arg Val Leu Val Pro Ile Ala Arg Lys Phe Thr Gly Arg Glu Lys Gly
    370                 375                 380
ttc tct gag tta cag cgg att gga atc gga tta gcc ctc tcc atc ctt      1200
Phe Ser Glu Leu Gln Arg Ile Gly Ile Gly Leu Ala Leu Ser Ile Leu
385                 390                 395                 400
gca atg cta tct gca gct ctt gtt gag ttg agg cgt tta gag atc gcc      1248
Ala Met Leu Ser Ala Ala Leu Val Glu Leu Arg Arg Leu Glu Ile Ala
                405                 410                 415
aga tct gaa ggt ctt att cat gag gat gtt gct gtt ccg atg agc att      1296
Arg Ser Glu Gly Leu Ile His Glu Asp Val Ala Val Pro Met Ser Ile
            420                 425                 430
ctt tgg caa ata ccg cag tat ttc ttg gtt ggc gct gct gag gtc ttt      1344
Leu Trp Gln Ile Pro Gln Tyr Phe Leu Val Gly Ala Ala Glu Val Phe
        435                 440                 445
gct gcc ata ggt cag gtt gag ttc ttc tac aat gaa gcc cct gat gcc      1392
Ala Ala Ile Gly Gln Val Glu Phe Phe Tyr Asn Glu Ala Pro Asp Ala
    450                 455                 460
atg agg agt ttg tgt agt gca ttt gcg ctt gta aca gtc tca ctg ggg      1440
Met Arg Ser Leu Cys Ser Ala Phe Ala Leu Val Thr Val Ser Leu Gly
465                 470                 475                 480
agc tat tta agc tca atc ata tta acc ttg gtg tca tat ttt aca act      1488
Ser Tyr Leu Ser Ser Ile Ile Leu Thr Leu Val Ser Tyr Phe Thr Thr
                485                 490                 495
caa gga ggg gat cct gga tgg atc cca gat aac ctg aat gaa ggc cac      1536
Gln Gly Gly Asp Pro Gly Trp Ile Pro Asp Asn Leu Asn Glu Gly His
            500                 505                 510
cta gat cgg ttc ttt tca ttg att gct ggg atc aac ttt gtg aat tta      1584
Leu Asp Arg Phe Phe Ser Leu Ile Ala Gly Ile Asn Phe Val Asn Leu
        515                 520                 525
ctg gtt ttc act ggt tgt gca atg aga tac aga tac aag aaa gca tga      1632
Leu Val Phe Thr Gly Cys Ala Met Arg Tyr Arg Tyr Lys Lys Ala
    530                 535                 540
<210>99
<211>543
<212>PRT
<213>Oryza rufipogon  株  5949
<220>
<221>misc_feature
<222>(1)..(1)
<223>位置1处Xaa代表                     Asn,Ser,Thr,Ile,Asp,Gly,
     Ala,Val,His,Arg,Pro,Leu,Tyr,Cys,或Phe.
<400>99
Xaa Thr Gly Asn Trp Arg Ala Cys Phe Phe Ile Leu Gly Asp Glu Cys
1               5                   10                  15
Cys Glu Arg Leu Ala Tyr Tyr Gly Ile Ala Lys Asn Leu Val Thr Tyr
            20                  25                  30
Leu Lys Thr Asn Leu His Gln Gly Asn Leu Glu Ala Ala Arg Asn Val
        35                  40                  45
Thr Thr Trp Gln Gly Thr Cys Tyr Leu Thr Pro Leu Ile Gly Ala Leu
    50                  55                  60
Leu Ala Asp Ser Tyr Trp Gly Lys Tyr Trp Thr Ile Ala Ala Phe Ser
65                  70                  75                  80
Ala Ile Tyr Phe Ile Gly Leu Val Ala Leu Thr Leu Ser Ala Ser Val
                85                  90                  95
Pro Ala Leu Gln Pro Pro Lys Cys Ser Gly Ser Ile Cys Pro Glu Ala
            100                 105                 110
Ser Leu Leu Gln Tyr Gly Val Phe Phe Ser Gly Leu Tyr Met Ile Ala
        115                 120                 125
Leu Gly Thr Gly Gly Ile Lys Pro Cys Val Ser Ser Phe Gly Ala Asp
    130                 135                 140
Gln Phe Asp Asp Ser Asp Pro Ala Asp Arg Val Lys Lys Gly Ser Phe
145                 150                 155                 160
Phe Asn Trp Phe Tyr Phe Cys Ile Asn Ile Gly Ala Phe Val Ser Gly
                165                 170                 175
Thr Val Ile Val Trp Ile Gln Asp Asn Ser Gly Trp Gly Ile Gly Phe
            180                 185                 190
Ala Ile Pro Thr Ile Phe Met Ala Leu Ala Ile Ala Ser Phe Phe Val
        195                 200                 205
Ala Ser Asn Met Tyr Arg Phe Gln Lys Pro Gly Gly Ser Pro Leu Thr
    210                 215                 220
Arg Val Cys Gln Val Val Val Ala Ala Phe Arg Lys Trp His Thr Glu
225                 230                 235                 240
Val Pro His Asp Thr Ser Leu Leu Tyr Glu Val Asp Gly Gln Thr Ser
                245                 250                 255
Ala Ile Glu Gly Ser Arg Lys Leu Glu His Thr Ser Glu Leu Glu Phe
            260                 265                 270
Phe Asp Lys Ala Ala Ile Ile Ser Ser Asp Asp Ala Lys Ser Asp Ser
        275                 280                 285
Phe Thr Asn Pro Trp Arg Leu Cys Thr Val Thr Gln Val Glu Glu Leu
    290                 295                 300
Lys Ile Leu Ile Arg Met Phe Pro Ile Trp Ala Thr Thr Ile Ile Phe
305                 310                 315                 320
Asn Ala Val Tyr Ala Gln Asn Ser Ser Met Phe Ile Glu Gln Gly Met
                325                 330                 335
Val Leu Asp Lys Arg Val Gly Ser Phe Ile Val Pro Pro Ala Ser Leu
            340                 345                 350
Ser Thr Phe Asp Val Ile Ser Val Ile Ile Trp Ile Pro Phe Tyr Asp
        355                 360                 365
Arg Val Leu Val Pro Ile Ala Arg Lys Phe Thr Gly Arg Glu Lys Gly
    370                 375                 380
Phe Ser Glu Leu Gln Arg Ile Gly Ile Gly Leu Ala Leu Ser Ile Leu
385                 390                 395                 400
Ala Met Leu Ser Ala Ala Leu Val Glu Leu Arg Arg Leu Glu Ile Ala
                405                 410                 415
Arg Ser Glu Gly Leu Ile His Glu Asp Val Ala Val Pro Met Ser Ile
            420                 425                 430
Leu Trp Gln Ile Pro Gln Tyr Phe Leu Val Gly Ala Ala Glu Val Phe
        435                 440                 445
Ala Ala Ile Gly Gln Val Glu Phe Phe Tyr Asn Glu Ala Pro Asp Ala
    450                 455                 460
Met Arg Ser Leu Cys Ser Ala Phe Ala Leu Val Thr Val Ser Leu Gly
465                 470                 475                 480
Ser Tyr Leu Ser Ser Ile Ile Leu Thr Leu Val Ser Tyr Phe Thr Thr
                485                 490                 495
Gln Gly Gly Asp Pro Gly Trp Ile Pro Asp Asn Leu Asn Glu Gly His
            500                 505                 510
Leu Asp Arg Phe Phe Ser Leu Ile Ala Gly Ile Asn Phe Val Asn Leu
        515                 520                 525
Leu Val Phe Thr Gly Cys Ala Met Arg Tyr Arg Tyr Lys Lys Ala
    530                 535                 540
<210>100
<211>2599
<212>DNA
<213>Oryza sativa  株  Azucena
<400>100
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgatataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcaccgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttgag    1260
taattcctgg atttttgcaa tgcatcattg tctcactttt attcattctg ttacaaagaa    1320
aaaaggagga aagtctggat ggggacaaca ccagccattt gcagttggat gtatacataa    1380
aactgataca ctaccttctt gtactgttcc attttgggat tggtggaaat taaatactaa    1440
atgcaacaaa aagaatatgg ataaggccat acagcagaac gctagtagta tattagtagt    1500
ttgtccatgg catgcaattc ttataagtct acttataatt actattactg gtgcctataa    1560
ttaatatggg accattagag gtatatttgt ataatgactg aaaatatcag ggtagcacaa    1620
gcaatatatg tcagtaggtg gcttgcttta cagacacatt tcttttactt ttttagacaa    1680
tataatatat tgtgttttct tgtctgactg aaattacttt ttgttataca gattctttga    1740
caaggctgcc atcatctcat ctgatgatgc caagagtgac tcctttacaa atccgtggag    1800
gctatgcact gtcacccagg tggaagaact gaaaattcta atcagaatgt ttcccatttg    1860
ggccactact attatattca acgcggtgta tgctcacaac tcttctatgt tcatagagca    1920
gggaatggtt cttgacaagc gagttggatc tttcattgtc cctcctgcat ccctctcaac    1980
ttttgatgtc atcagtgtca tcatctggat tccgttttat ggccgtgtgc ttgtgccaat    2040
agctagaaag ttcactggaa gggagaaggg tttctctgag ttacagcgga ttggaatcgg    2100
attagccctc tccatccttg caatgctatc tgcagctctt gttgagttga ggcgtttagg    2160
gatcgccaga tctgaaggtc ttattcatga ggatgttgct gttccgatga gcattctttg    2220
gcaaataccg cagtatttct tggttggcgc tgctgaggtc tttgctgcca taggtcaggt    2280
tgagttcttc tacaatgaag cccctgatgc catgaggagt ttgtgtagtg catttgcgct    2340
tgtaacagtc tcactgggga gctatttaag ctcaatcata ttaaccttgg tgtcatattt    2400
tacaactcaa ggaggggatc ctggatggat cccagataac ctgaatgaag gccacctaga    2460
tcggttcttt tcattgattg ctgggatcaa ctttgtgaat ttactggttt tcactggttg    2520
tgcaatgaga tacagataca agaaagcatg atgactgtac tcatggtaag gtcagtttgt    2580
gttagtaata acagatttt                                                 2599
<210>101
<211>1659
<212>DNA
<213>Oryza sativa  株  Azucena
<220>
<221>CDS
<222>(1)..(1659)
<400>101
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc acc gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cac aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala His Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt tat ggc cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Tyr Gly Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta ggg atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Gly Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>102
<211>552
<212>PRT
<213>Oryza sativa  株  Azucena
<400>102
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala His Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Tyr Gly Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Gly Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>103
<211>2601
<212>DNA
<213>Oryza sativa  株  IR64
<400>103
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgacataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcaccgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttgag    1260
taattcctgg atttttgcaa tgcatcattg tctcactttt attcattctg ttacaaagaa    1320
aaaaggggga aagtctggat ggggacaaca ccagccattt gcagttggat gtatacataa    1380
aactgataca ctaccttctt gtactgttcc attttgggat tggtggaaat taaatactaa    1440
atgcaacaaa aagaatatgg ataaggccat acagcagaac gctagtagta tattagtagt    1500
ttgtccatgg catgcaattc ttataagtct acttataatt actattactg gtgcctataa    1560
ttaatatggg accattagag gtatatttgt ataatgactg aaaatatcag ggtagcacaa    1620
gcaatatatg tcagtaggtg gcttgcttta cagacacatt tcttttactt ttttttagac    1680
aatataatat attgtgtttt cttgtctgac tgaaattact ttttgttata cagattcttt    1740
gacaaggctg ccatcatctc atctgatgat gccaagagtg actcctttac aaatccgtgg    1800
aggctatgca ctgtcaccca ggtggaagaa ctgaaaattc taatcagaat gtttcccatt    1860
tgggccacta ctattatatt caacgcggtg tatgctcaga actcttctat gttcatagag    1920
cagggaatgg ttcttgacaa gcgagttgga tctttcattg tccctcctgc atccctctca    1980
acttttgatg tcatcagtgt catcatctgg attccgtttt atgaccgtgt gcttgtgcca    2040
atagctagaa agttcactgg aagggagaag ggtttctctg agttacagcg gattggaatc    2100
ggattagccc tctccatcct tgcaatgcta tctgcagctc ttgttgagtt gaggcgttta    2160
gagatcgcca gatctgaagg tcttattcat gaggatgttg ctgttccgat gagcattctt    2220
tggcaaatac cgcagtattt cttggttggc gctgctgagg tctttgctgc cataggtcag    2280
gttgagttct tctacaatga agcccctgat gccatgagga gtttgtgtag tgcatttgcg    2340
cttgtaacag tctcactggg gagctattta agctcaatca tattaacctt ggtgtcatat    2400
tttacaactc aaggagggga tcctggatgg atcccagata acctgaatga aggccaccta    2460
gatcggttct tttcattgat tgctgggatc aactttgtga atttactggt tttcactggt    2520
tgtgcaatga gatacagata caagaaagca tgatgactgt actcatggta aggtcagttt    2580
gtgtaagtaa taacagattt t                                              2601
<210>104
<211>1659
<212>DNA
<213>Oryza sativa  株  IR64
<220>
<221>CDS
<222>(1)..(1659)
<400>104
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc acc gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cag aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt tat gac cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Tyr Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta gag atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>105
<211>552
<212>PRT
<213>Oryza sativa  株  IR64
<400>105
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Tyr Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>106
<211>2601
<212>DNA
<213>Oryza sativa  株  Kasalath
<400>106
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgacataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcactgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttgag    1260
taattcctgg atttttgcaa tgcatcattg tctcactttt attcattctg ttacaaagaa    1320
aaaaggggga aagtctggat ggggacaaca ccagccattt gcagttggat gtatacataa    1380
aactgataca ctaccttctt gtactgttcc attttgggat tggtggaaat taaatactaa    1440
atgcaacaaa aagaatatgg ataaggccat acagcagaac gctagtagta tattagtagt    1500
ttgtccatgg catgcaattc ttataagtct acttataatt actattactg gtgcctataa    1560
ttaatatggg accattagag gtatatttgt ataatgactg aaaatatcag ggtagcacaa    1620
gcaatatatg tcagtaggtg gcttgcttta cagacacatt tcttttactt ttttttagac    1680
aatataatat attgtgtttt cttgtctgac tgaaattact ttttgttata cagattcttt    1740
gacaaggctg ccatcatctc atctgatgat gccaagagtg actcctttac aaatccgtgg    1800
aggctatgca ctgtcaccca ggtggaagaa ctgaaaattc taatcagaat gtttcccatt    1860
tgggccacta ctattatatt caacgcggtg tatgctcaga actcttctat gttcatagag    1920
cagggaatgg ttcttgacaa gcgagttgga tctttcattg tccctcctgc atccctctca    1980
acttttgatg tcatcagtgt catcatctgg attccgttta atgaccgtgt gcttgtgcca    2040
atagctagaa agttcactgg aagggagaag ggtttctctg agttacagcg gattggaatc    2100
ggattagccc tctccatcct tgcaatgcta tctgcagctc ttgttgagtt gaggcgttta    2160
gagatcgcca gatctgaagg tcttattcat gaggatgttg ctgttccgat gagcattctt    2220
tggcaaatac cgcagtattt cttggttggc gctgctgagg tctttgctgc cataggtcag    2280
gttgagttct tctacaatga agcccctgat gccatgagga gtttgtgtag tgcatttgcg    2340
cttgtaacag tctcactggg gagctattta agctcaatca tattaacctt ggtgtcatat    2400
tttacaactc aaggagggga tcctggatgg atcccagata acctgaatga aggccaccta    2460
gatcggttct tttcattgat tgctgggatc aactttgtga atttactggt tttcactggt    2520
tgtgcaatga gatacagata caagaaagca tgatgactgt actcatggta aggtcagttt    2580
gtgtaagtaa taacagattt t                                              2601
<210>107
<211>1659
<212>DNA
<213>Oryza sativa  株  Kasalath
<220>
<221>CDS
<222>(1)..(1659)
<400>107
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc act gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cag aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt aat gac cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Asn Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta gag atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>108
<211>552
<212>PRT
<213>Oryza sativa  株  Kasalath
<400>108
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Asn Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>109
<211>2599
<212>DNA
<213>Oryza sativa  株  Lemont
<400>109
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgatataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcaccgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttgag    1260
taattcctgg atttttgcaa tgcatcattg tctcactttt attcattctg ttacaaagaa    1320
aaaaggagga aagtctggat ggggacaaca ccagccattt gcagttggat gtatacataa    1380
aactgataca ctaccttctt gtactgttcc attttgggat tggtggaaat taaatactaa    1440
atgcaacaaa aagaatatgg ataaggccat acagcagaac gctagtagta tattagtagt    1500
ttgtccatgg catgcaattc ttataagtct acttataatt actattactg gtgcctataa    1560
ttaatatggg accattagag gtatatttgt ataatgactg aaaatatcag ggtagcacaa    1620
gcaatatatg tcagtaggtg gcttgcttta cagacacatt tcttttactt ttttagacaa    1680
tataatatat tgtgttttct tgtctgactg aaattacttt ttgttataca gattctttga    1740
caaggctgcc atcatctcat ctgatgatgc caagagtgac tcctttacaa atccgtggag    1800
gctatgcact gtcacccagg tggaagaact gaaaattcta atcagaatgt ttcccatttg    1860
ggccactact attatattca acgcggtgta tgctcacaac tcttctatgt tcatagagca    1920
gggaatggtt cttgacaagc gagttggatc tttcattgtc cctcctgcat ccctctcaac    1980
ttttgatgtc atcagtgtca tcatctggat tccgttttat ggccgtgtgc ttgtgccaat    2040
agctagaaag ttcactggaa gggagaaggg tttctctgag ttacagcgga ttggaatcgg    2100
attagccctc tccatccttg caatgctatc tgcagctctt gttgagttga ggcgtttagg    2160
gatcgccaga tctgaaggtc ttattcatga ggatgttgct gttccgatga gcattctttg    2220
gcaaataccg cagtatttct tggttggcgc tgctgaggtc tttgctgcca taggtcaggt    2280
tgagttcttc tacaatgaag cccctgatgc catgaggagt ttgtgtagtg catttgcgct    2340
tgtaacagtc tcactgggga gctatttaag ctcaatcata ttaaccttgg tgtcatattt    2400
tacaactcaa ggaggggatc ctggatggat cccagataac ctgaatgaag gccacctaga    2460
tcggttcttt tcattgattg ctgggatcaa ctttgtgaat ttactggttt tcactggttg    2520
tgcaatgaga tacagataca agaaagcatg atgactgtac tcatggtaag gtcagtttgt    2580
gttagtaata acagatttt                                                 2599
<210>110
<211>1659
<212>DNA
<213>Oryza sativa  株  Lemont
<220>
<221>CDS
<222>(1)..(1659)
<400>110
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc acc gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cac aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala His Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt tat ggc cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Tyr Gly Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta ggg atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Gly Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>111
<211>552
<212>PRT
<213>Oryza sativa  株  Lemont
<400>111
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala His Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Tyr Gly Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Gly Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>112
<211>1259
<212>DNA
<213>Oryza sativa  株  Nipponbare
<400>112
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgatataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcaccgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttga     1259
<210>113
<211>864
<212>DNA
<213>Oryza sativa  株  Nipponbare
<400>113
attctttgac aaggctgcca tcatctcatc tgatgatgcc aagagtgact cctttacaaa      60
tccgtggagg ctatgcactg tcacccaggt ggaagaactg aaaattctaa tcagaatgtt     120
tcccatttgg gccactacta ttatattcaa cgcggtgtat gctcacaact cttctatgtt     180
catagagcag ggaatggttc ttgacaagcg agttggatct ttcattgtcc ctcctgcatc     240
cctctcaact tttgatgtca tcagtgtcat catctggatt ccgttttatg gccgtgtgct     300
tgtgccaata gctagaaagt tcactggaag ggagaagggt ttctctgagt tacagcggat     360
tggaatcgga ttagccctct ccatccttgc aatgctatct gcagctcttg ttgagttgag     420
gcgtttaggg atcgccagat ctgaaggtct tattcatgag gatgttgctg ttccgatgag     480
cattctttgg caaataccgc agtatttctt ggttggcgct gctgaggtct ttgctgccat     540
aggtcaggtt gagttcttct acaatgaagc ccctgatgcc atgaggagtt tgtgtagtgc     600
atttgcgctt gtaacagtct cactggggag ctatttaagc tcaatcatat taaccttggt     660
gtcatatttt acaactcaag gaggggatcc tggatggatc ccagataacc tgaatgaagg     720
ccacctagat cggttctttt cattgattgc tgggatcaac tttgtgaatt tactggtttt     780
cactggttgt gcaatgagat acagatacaa gaaagcatga tgactgtact catggtaagg     840
tcagtttgtg ttagtaataa caga                                            864
<210>114
<211>1659
<212>DNA
<213>Oryza sativa  株  Nipponbare
<220>
<221>CDS
<222>(1)..(1659)
<400>114
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc acc gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cac aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala His Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt tat ggc cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Tyr Gly Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta ggg atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Gly Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>115
<211>552
<212>PRT
<213>Oryza sativa  株  Nipponbare
<400>115
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala His Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Tyr Gly Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Gly Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                490                  495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>116
<211>2601
<212>DNA
<213>Oryza sativa  株  Teqing
<400>116
atcaaagggc gccctgcatt aaagcatgcc actggaaatt ggcgtgcatg ttttttcatc      60
ctaggtaatt tgttaaagat gcatagcata tcccataaaa ctttggcaca gtacttgaag     120
gaattccttg tttcttcgca ctagtgagta atgcttctat atggttttga atcgtacaat     180
cctgtattta ccttttgcca aaatattttg gtgacataca acacaaaaga aatgctggtc     240
gaagtaccag atagcatact ttacagatca attgaaaaat gctgtgcaca tttttatctg     300
ttctgcaatg agtagctttg aagtttcaga aatgctagtt tggtgacagg ggatgaatgc     360
tgtgagagac tggcctatta tggtattgca aagaacctag ttacttatct gaaaacaaat     420
cttcatcaag gcaaccttga agctgcaaga aatgttacaa cttggcaggg gacatgctac     480
ctaacacccc tcattggtgc cctcctagca gattcttact ggggaaagta ctggactatt     540
gctgctttct cagcaattta ttttattgta agtacaagcc tattgctata gaagatatta     600
gatattacct acttcggtgc acttgcacca tgtgctgaac tgatcttttc aaaataattt     660
catatctgaa acatggataa tttctgaact tttttactga agggtctggt tgctttgacg     720
ctgtcagcat cagttccagc tctgcagccg cctaaatgtt caggatctat ttgtccagaa     780
gcaagcttac tccagtatgg tgtatttttc tctggcctct atatgatagc cctcgggact     840
ggaggcatca aaccttgtgt atcatccttt ggagctgatc aatttgatga cagtgatcca     900
gcagacagag taaagaaggg ctccttcttc aattggtttt acttctgtat aaatatcggt     960
gcatttgtat caggcaccgt tatagtttgg atacaagata actcaggttg ggggatagga    1020
tttgccattc ctactatatt tatggcatta gcgattgcaa gtttctttgt tgcctcaaat    1080
atgtacagat ttcagaaacc tggtggaagc cctcttacaa gagtgtgtca ggttgttgtt    1140
gcagcattcc gtaagtggca cactgaagtg ccacatgata catctctttt atatgaggtt    1200
gatggccaga cttcagcgat tgagggaagc cggaagctgg agcacacaag tgaacttgag    1260
taattcctgg atttttgcaa tgcatcattg tctcactttt attcattctg ttacaaagaa    1320
aaaaggggga aagtctggat ggggacaaca ccagccattt gcagttggat gtatacataa    1380
aactgataca ctaccttctt gtactgttcc attttgggat tggtggaaat taaatactaa    1440
atgcaacaaa aagaatatgg ataaggccat acagcagaac gctagtagta tattagtagt    1500
ttgtccatgg catgcaattc ttataagtct acttataatt actattactg gtgcctataa    1560
ttaatatggg accattagag gtatatttgt ataatgactg aaaatatcag ggtagcacaa    1620
gcaatatatg tcagtaggtg gcttgcttta cagacacatt tcttttactt ttttttagac    1680
aatataatat attgtgtttt cttgtctgac tgaaattact ttttgttata cagattcttt    1740
gacaaggctg ccatcatctc atctgatgat gccaagagtg actcctttac aaatccgtgg    1800
aggctatgca ctgtcaccca ggtggaagaa ctgaaaattc taatcagaat gtttcccatt    1860
tgggccacta ctattatatt caacgcggtg tatgctcaga actcttctat gttcatagag    1920
cagggaatgg ttcttgacaa gcgagttgga tctttcattg tccctcctgc atccctctca    1980
acttttgatg tcatcagtgt catcatctgg attccgtttt atgaccgtgt gcttgtgcca    2040
atagctagaa agttcactgg aagggagaag ggtttctctg agttacagcg gattggaatc    2100
ggattagccc tctccatcct tgcaatgcta tctgcagctc ttgttgagtt gaggcgttta    2160
gagatcgcca gatctgaagg tcttattcat gaggatgttg ctgttccgat gagcattctt    2220
tggcaaatac cgcagtattt cttggttggc gctgctgagg tctttgctgc cataggtcag    2280
gttgagttct tctacaatga agcccctgat gccatgagga gtttgtgtag tgcatttgcg    2340
cttgtaacag tctcactggg gagctattta agctcaatca tattaacctt ggtgtcatat    2400
tttacaactc aaggagggga tcctggatgg atcccagata acctgaatga aggccaccta    2460
gatcggttct tttcattgat tgctgggatc aactttgtga atttactggt tttcactggt    2520
tgtgcaatga gatacagata caagaaagca tgatgactgt actcatggta aggtcagttt    2580
gtgtaagtaa taacagattt t                                              2601
<210>117
<211>1659
<212>DNA
<213>Oryza sativa  株  Teqing
<220>
<221>CDS
<222>(1)..(1659)
<400>117
atc aaa ggg cgc cct gca tta aag cat gcc act gga aat tgg cgt gca        48
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
tgt ttt ttc atc cta ggg gat gaa tgc tgt gag aga ctg gcc tat tat        96
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
ggt att gca aag aac cta gtt act tat ctg aaa aca aat ctt cat caa       144
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
ggc aac ctt gaa gct gca aga aat gtt aca act tgg cag ggg aca tgc       192
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
tac cta aca ccc ctc att ggt gcc ctc cta gca gat tct tac tgg gga       240
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
aag tac tgg act att gct gct ttc tca gca att tat ttt att ggt ctg       288
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
gtt gct ttg acg ctg tca gca tca gtt cca gct ctg cag ccg cct aaa       336
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
tgt tca gga tct att tgt cca gaa gca agc tta ctc cag tat ggt gta       384
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
ttt ttc tct ggc ctc tat atg ata gcc ctc ggg act gga ggc atc aaa       432
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
cct tgt gta tca tcc ttt gga gct gat caa ttt gat gac agt gat cca       480
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
gca gac aga gta aag aag ggc tcc ttc ttc aat tgg ttt tac ttc tgt       528
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
ata aat atc ggt gca ttt gta tca ggc acc gtt ata gtt tgg ata caa       576
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
gat aac tca ggt tgg ggg ata gga ttt gcc att cct act ata ttt atg       624
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
gca tta gcg att gca agt ttc ttt gtt gcc tca aat atg tac aga ttt       672
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
cag aaa cct ggt gga agc cct ctt aca aga gtg tgt cag gtt gtt gtt       720
Gln Lys Pro Gly Gly Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
gca gca ttc cgt aag tgg cac act gaa gtg cca cat gat aca tct ctt       768
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
tta tat gag gtt gat ggc cag act tca gcg att gag gga agc cgg aag       816
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
ctg gag cac aca agt gaa ctt gaa ttc ttt gac aag gct gcc atc atc       864
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
tca tct gat gat gcc aag agt gac tcc ttt aca aat ccg tgg agg cta       912
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
tgc act gtc acc cag gtg gaa gaa ctg aaa att cta atc aga atg ttt       960
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
ccc att tgg gcc act act att ata ttc aac gcg gtg tat gct cag aac      1008
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
tct tct atg ttc ata gag cag gga atg gtt ctt gac aag cga gtt gga      1056
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
tct ttc att gtc cct cct gca tcc ctc tca act ttt gat gtc atc agt      1104
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
gtc atc atc tgg att ccg ttt tat gac cgt gtg ctt gtg cca ata gct      1152
Val Ile Ile Trp Ile Pro Phe Tyr Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
aga aag ttc act gga agg gag aag ggt ttc tct gag tta cag cgg att      1200
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
gga atc gga tta gcc ctc tcc atc ctt gca atg cta tct gca gct ctt      1248
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
gtt gag ttg agg cgt tta gag atc gcc aga tct gaa ggt ctt att cat      1296
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
gag gat gtt gct gtt ccg atg agc att ctt tgg caa ata ccg cag tat      1344
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
ttc ttg gtt ggc gct gct gag gtc ttt gct gcc ata ggt cag gtt gag      1392
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
ttc ttc tac aat gaa gcc cct gat gcc atg agg agt ttg tgt agt gca      1440
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
ttt gcg ctt gta aca gtc tca ctg ggg agc tat tta agc tca atc ata      1488
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
tta acc ttg gtg tca tat ttt aca act caa gga ggg gat cct gga tgg      1536
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
atc cca gat aac ctg aat gaa ggc cac cta gat cgg ttc ttt tca ttg      1584
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
att gct ggg atc aac ttt gtg aat tta ctg gtt ttc act ggt tgt gca      1632
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
atg aga tac aga tac aag aaa gca tga                                  1659
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>118
<211>552
<212>PRT
<213>Oryza sativa  株  Teqing
<400>118
Ile Lys Gly Arg Pro Ala Leu Lys His Ala Thr Gly Asn Trp Arg Ala
1               5                   10                  15
Cys Phe Phe Ile Leu Gly Asp Glu Cys Cys Glu Arg Leu Ala Tyr Tyr
            20                  25                  30
Gly Ile Ala Lys Asn Leu Val Thr Tyr Leu Lys Thr Asn Leu His Gln
        35                  40                  45
Gly Asn Leu Glu Ala Ala Arg Asn Val Thr Thr Trp Gln Gly Thr Cys
    50                  55                  60
Tyr Leu Thr Pro Leu Ile Gly Ala Leu Leu Ala Asp Ser Tyr Trp Gly
65                  70                  75                  80
Lys Tyr Trp Thr Ile Ala Ala Phe Ser Ala Ile Tyr Phe Ile Gly Leu
                85                  90                  95
Val Ala Leu Thr Leu Ser Ala Ser Val Pro Ala Leu Gln Pro Pro Lys
            100                 105                 110
Cys Ser Gly Ser Ile Cys Pro Glu Ala Ser Leu Leu Gln Tyr Gly Val
        115                 120                 125
Phe Phe Ser Gly Leu Tyr Met Ile Ala Leu Gly Thr Gly Gly Ile Lys
    130                 135                 140
Pro Cys Val Ser Ser Phe Gly Ala Asp Gln Phe Asp Asp Ser Asp Pro
145                 150                 155                 160
Ala Asp Arg Val Lys Lys Gly Ser Phe Phe Asn Trp Phe Tyr Phe Cys
                165                 170                 175
Ile Asn Ile Gly Ala Phe Val Ser Gly Thr Val Ile Val Trp Ile Gln
            180                 185                 190
Asp Asn Ser Gly Trp Gly Ile Gly Phe Ala Ile Pro Thr Ile Phe Met
        195                 200                 205
Ala Leu Ala Ile Ala Ser Phe Phe Val Ala Ser Asn Met Tyr Arg Phe
    210                 215                 220
Gln Lys Pro Gly GIy Ser Pro Leu Thr Arg Val Cys Gln Val Val Val
225                 230                 235                 240
Ala Ala Phe Arg Lys Trp His Thr Glu Val Pro His Asp Thr Ser Leu
                245                 250                 255
Leu Tyr Glu Val Asp Gly Gln Thr Ser Ala Ile Glu Gly Ser Arg Lys
            260                 265                 270
Leu Glu His Thr Ser Glu Leu Glu Phe Phe Asp Lys Ala Ala Ile Ile
        275                 280                 285
Ser Ser Asp Asp Ala Lys Ser Asp Ser Phe Thr Asn Pro Trp Arg Leu
    290                 295                 300
Cys Thr Val Thr Gln Val Glu Glu Leu Lys Ile Leu Ile Arg Met Phe
305                 310                 315                 320
Pro Ile Trp Ala Thr Thr Ile Ile Phe Asn Ala Val Tyr Ala Gln Asn
                325                 330                 335
Ser Ser Met Phe Ile Glu Gln Gly Met Val Leu Asp Lys Arg Val Gly
            340                 345                 350
Ser Phe Ile Val Pro Pro Ala Ser Leu Ser Thr Phe Asp Val Ile Ser
        355                 360                 365
Val Ile Ile Trp Ile Pro Phe Tyr Asp Arg Val Leu Val Pro Ile Ala
    370                 375                 380
Arg Lys Phe Thr Gly Arg Glu Lys Gly Phe Ser Glu Leu Gln Arg Ile
385                 390                 395                 400
Gly Ile Gly Leu Ala Leu Ser Ile Leu Ala Met Leu Ser Ala Ala Leu
                405                 410                 415
Val Glu Leu Arg Arg Leu Glu Ile Ala Arg Ser Glu Gly Leu Ile His
            420                 425                 430
Glu Asp Val Ala Val Pro Met Ser Ile Leu Trp Gln Ile Pro Gln Tyr
        435                 440                 445
Phe Leu Val Gly Ala Ala Glu Val Phe Ala Ala Ile Gly Gln Val Glu
    450                 455                 460
Phe Phe Tyr Asn Glu Ala Pro Asp Ala Met Arg Ser Leu Cys Ser Ala
465                 470                 475                 480
Phe Ala Leu Val Thr Val Ser Leu Gly Ser Tyr Leu Ser Ser Ile Ile
                485                 490                 495
Leu Thr Leu Val Ser Tyr Phe Thr Thr Gln Gly Gly Asp Pro Gly Trp
            500                 505                 510
Ile Pro Asp Asn Leu Asn Glu Gly His Leu Asp Arg Phe Phe Ser Leu
        515                 520                 525
Ile Ala Gly Ile Asn Phe Val Asn Leu Leu Val Phe Thr Gly Cys Ala
    530                 535                 540
Met Arg Tyr Arg Tyr Lys Lys Ala
545                 550
<210>119
<211>531
<212>DNA
<213>Zea mays mays  株  BS7
<400>119
atggttcttg acaagcgcat tgggtctttc aacattcctc ctgcatctct ctccactttt      60
gatgtaatca gcgtcatcat gtgggtccca ctctatgacc gcatcctggt gccactagct     120
agaaaattca ctggaaggga gaagggtttt tctgagctac agcggatggg aattggatta     180
gtcctgtcca ttctcgcgat ggtatctgca gctctagttg agttgaagcg tttagagatt     240
gccaggtctg aaggtctcat tcatgagaag gctgctgttc caatgagcat tctttggcaa     300
ataccacaat atttcttggt gggcgctgct gaggtgttta cttgtattgg tcaagttgag     360
ttcttttacg atcaggcccc agatgccatg aggagtttat gtagtgcact tgcacttatt     420
acagtctcac tgggaaacta tataagctcc atcatactga cattggtgtc gtacattaca     480
actcagggag gagatcctgg atggatccct gacaatctga atgaaggcca t              531
<210>120
<211>536
<212>DNA
<213>Zea mays mays  株  Enano
<400>120
gaccaagcag agagagctaa gaagggttca ttcttcaatt ggttctactt ctgtataaat      60
ataggttcat tcatatcagg cactatgata gtgtggatac aagataacac tggttgggga     120
ataggctttg cgattcctac tatattcatg gcattagcta tttcattctt cttctcagct     180
tcaaataagt acagattcca aaaacctggt gggagtccac tcacaagagt gtgccaggtg     240
gttatagcag catttcgtaa gtggcacatt gaagtgccac atgatacatc tctcctatat     300
gaagttgatg gccaaacttc agcaattgaa ggaagccgga agctggagca cacaaatgag     360
ctcgagtaat tctaattttc tgcaatgcaa tcacttcttt agtttcagta tcatgtgatg     420
caacatttat ggaatatttg ggaatgacag tacttatatg tcataaagac attgaacttc     480
actgcaaagt ttttattatt tcaacttgag gatactggaa aattagtaca taaata         536
<210>121
<211>550
<212>DNA
<213>Zea mays mays  株  Enano
<400>121
aaacaacact ggtttgtgag tttatgacaa agagtagtag tatgttgtag ttctacaaga      60
catccgacaa tagaaatagt ggctgccact taattctcaa tactcactac tcagcagtca     120
atagtaatcc aaattaatct gaaactccgt ggaggaagca aatgcaccgt gacacatgtt     180
actgtgtact tgtgatcttg ttaaatgctt gcttgtaaat gcaacgattg taactaagta     240
acataactta aggctcagga ggaccagaca catgttactt gcataattgt atttttttca     300
agtatgttat gcctgtaagg agcttgattt gtggatttca tatcttttat tgtgtggcta     360
ctataatatt ttatctacct ctcttgtgtg taggttcctt gatagagctg ctgttatctc     420
atctgctgat ctgaagagtg aatcctttac cgacccatgg aagctttgca cagttaccca     480
ggtggaagaa ttgaagatcc taataagaat gtttcccatt tgggctacta ctatcatatt     540
cagtgctgtt                                                            550
<210>122
<211>533
<212>DNA
<213>Zea mays mays  株  Enano
<400>122
atggttcttg acaagcgcat tgggtctttc aacattcctc ctgcatctct ctccactttt      60
gatgtaatca gcgtcatcat gtgggtccca ctctatgacc gcatcctggt gccactagct     120
agaaaattca ctggaaggga gaagggtttt tctgagctac agcggatggg aattggatta     180
gtcctgtcca ttctcgcgat ggtatctgca gctctagttg agttgaagcg tttagagatt     240
gccaggtctg aaggtctcat tcatgagaag gctgctgttc caatgagcat tctttggcaa     300
ataccacaat atttcttggt gggcgctgct gaggtgttta cttgtattgg tcaagttgag     360
ttcttttacg atcaggcccc agatgccatg aggagtttat gtagtgcact tgcacttatt     420
acagtctcac tgggaaacta tataagctcc atcatactga cattggtgtc gtacattaca     480
actcagggag gagatcctgg atggatccct gacaatctga atgaaggcca tct            533
<210>123
<211>525
<212>DNA
<213>Zea mays mays  株  Huobai
<400>123
tgatgacact gaccaagcag agagagctaa gaagggttca ttcttcaatt ggttctactt      60
ctgtataaat ataggttcat tcatatcagg cactatgata gtgtggatac aagataacac     120
tggttgggga ataggctttg cgattcctac tatattcatg gcattagcta tttcattctt     180
cttctcagct tcaaataagt acagattcca aaaacctggt gggagtccac tcacaagagt     240
gtgccaggtg gttatagcag catttcgtaa gtggcacatt gaagtgccac atgatacatc     300
tctcctatat gaagttgatg gccaaacttc agcaattgaa ggaagccgga agctggagca     360
cacaaatgag ctcgagtaat tctaattttc tgcaatgcaa tcacttcttt agtttcagta     420
tcatgtgatg caacatttat ggaatatttg gaaatgacag tacttatatg tcataaagac     480
attgaacttc actgcaaagt ttttattatt tcaacttgag gatac                     525
<210>124
<211>334
<212>DNA
<213>Zea mays mays  株  Huobai
<400>124
aggctcagga ggaccagaca catgttactt gcataattgt atttttttca agtatgttat      60
gcctgtaagg agcttgattt gtggatttca tatcttttat tgtgtggcta ctataatatt     120
ttatctacct ctcttgtgtg taggttcctt gatagagctg ctgttatctc atctgctgat     180
ctgaagagtg aattctttac cgacccatgg aagctttgca cagttaccca ggtggaagaa     240
ttgaagatcc taataagaat gtttcccatt tgggctacta ctatcatatt cagtgctgtt     300
tatgcccaaa actcttccat gttcatagag cagg                                 334
<210>125
<211>529
<212>DNA
<213>Zea mays mays  株  Huobai
<400>125
gggcatggtt cttgacaagc gcattgggtc tttcaacatt cctcctgcat ctctctccac      60
ttttgatgta atcagcgtca tcatgtgggt cccactctat gaccgcatcc tggtgccact     120
agctagaaaa ttcactggaa gggagaaggg tttttctgag ctacagcgga tgggaattgg     180
attagtcctg tccattctcg cgatggtatc tgcagctcta gttgagttga agcgtttaga     240
gattgccagg tctgaaggtc tcattcatga gaaggctgct gttccaatga gcattctttg     300
gcaaatacca caatatttct tggtgggcgc tgctgaggtg tttacttgta ttggtcaagt     360
tgagttcttt tacgatcagg ccccagatgc catgaggagt ttatgtagtg cacttgcact     420
tattacagtc tcactgggaa actatataag ctccatcata ctgacattgg tgtcgtacat     480
tacaactcag ggaggagatc ctggatggat ccctgacaat ctgaatgaa                 529
<210>126
<211>513
<212>DNA
<213>Zea mays mays  株  Makki
<400>126
ggcatggttc ttgacaagcg cattgggtct ttcaacattc ctcctgcatc tctctccact      60
tttgatgtaa tcagcgtcat catgtgggtc ccactctatg accgcatcct ggtgccacta     120
gctagaaaat tcactggaag ggagaagggt ttttctgagc tacagcggat gggaattgga     180
ttagtcctgt ccattctcgc gatggtatct gcagctctag ttgagttgaa gcgtttagag     240
attgccaggt ctgaaggtct cattcatgag aaggctgctg ttccaatgag cattctttgg     300
caaataccac aatatttctt ggtgggcgct gctgaggtgt ttacttgtat tggtcaagtt     360
gagttctttt acgatcaggc cccagatgcc atgaggagtt tatgtagtgc acttgcactt     420
attacagtct cactgggaaa ctatataagc tccatcatac tgacattggt gtcgtacatt     480
acaactcagg gaggagatcc tggatggatc cct                                  513
<210>127
<211>545
<212>DNA
<213>Zea mays mays  株  Min13
<400>127
gatgacactg accaagcaga gagagctaag aagggttcat tcttcaattg gttctacttc      60
tgtataaata taggttcatt catatcaggc actatgatag tgtggataca agataacact     120
ggttggggaa taggctttgc gattcctact atattcatgg cattagctat ttcattcttc     180
ttctcagctt caaataagta cagattccaa aaacctggtg ggagtccact cacaagagtg     240
tgccaggtgg ttatagcagc atttcgtaag tggcacattg aagtgccaca tgatacatct     300
ctcctatatg aagttgatgg ccaaacttca gcaattgaag gaagccggaa gctggagcac     360
acaaatgagc tcgagtaatt ctaattttct gcaatgcaat cacttcttta gtttcagtat     420
catgtgatgc aacatttatg gaatatttgg gaatgacagt acttatatgt cataaagaca     480
ttgaacttca ctgcaaagtt tttattattt caacttgagg atactggaaa attagtacat     540
aaata                                                                 545
<210>128
<211>570
<212>DNA
<213>Zea mays mays  株  Min13
<400>128
caacacttgt ttgtgagttt atgacaaaga gtagtagtat gttgtagttc tacaagacat      60
ccgacaatag aaatagtggc tgccacttaa ttctcaatac tcactactca gcagtcaata     120
gtaatccaaa ttaatctgaa actccgtgga ggaagcaaat gcaccgtgac acatgttact     180
gtgtacttgt gatcttgtta aatgcttgct tgtaaatgca acgattgtaa ctaagtaaca     240
taacttaagg ctcaggagga ccagacacat gttacttgca taattgtatt tttttcaagt     300
atgttatgcc tgtaaggagc ttgatttgtg gatttcatat cttttattgt gtggctacta     360
taatatttta tctacctctc ttgtgtgtag gttccttgat agagctgctg ttatctcatc     420
tgctgatctg aagagtgaat cctttaccga cccatggaag ctttgcacag ttacccaggt     480
ggaagaattg aagatcctaa taagaatgtt tcccatttgg gctactacta tcatattcag     540
tgctgtttat gcccaaaact cttccatgtt                                      570
<210>129
<211>525
<212>DNA
<213>Zea mays mays  株  Min13
<400>129
ggcatggttc ttgacaagcg cattgggtct ttcaacattc ctcctgcatc tctctccact      60
tttgatgtaa tcagcgtcat catgtgggtc ccactctatg accgcatcct ggtgccacta     120
gctagaaaat tcactggaag ggagaagggt ttttctgagc tacagcggat gggaattgga     180
ttagtcctgt ccattctcgc gatggtatct gcagctctag ttgagttgaa gcgtttagag     240
attgccaggt ctgaaggtct cattcatgag aaggctgctg ttccaatgag cattctttgg     300
caaataccac aatatttctt ggtgggcgct gctgaggtgt ttacttgtat tggtcaagtt     360
gagttctttt acgatcaggc cccagatgcc atgaggagtt tatgtagtgc acttgcactt     420
attacagtct cactgggaaa ctatataagc tccatcatac tgacattggt gtcgtacatt     480
acaactcagg gaggagatcc tggatggatc cctgacaatc tgaat                     525
<210>130
<211>526
<212>DNA
<213>Zea mays mays  株  Pira
<400>130
gacactgacc aagcagagag agctaagaag ggttcattct tcaattggtt ctacttctgt      60
ataaatatag gttcattcat atcaggcact atgatagtgt ggatacaaga taacactggt     120
tggggaatag gctttgcgat tcctactata ttcatggcat tagctatttc attcttcttc     180
tcagcttcaa ataagtacag attccaaaaa cctggtggga gtccactcac aagagtgtgc     240
caggtggtta tagcagcatt tcgtaagtgg cacattgaag tgccacatga tacatctctc     300
ctatatgaag ttgatggcca aacttcagca attgaaggaa gccggaagct ggagcacaca     360
aatgagctcg agtaattcta attttctgca atgcaatcac ttctttagtt tcagtatcat     420
gtgatgcaac atttatggaa tatttgggaa tgacagtact tatatgtcat aaagacattg     480
aacttcactg caaagttttt attatttcaa cttgaggata ctggaa                    526
<210>131
<211>525
<212>DNA
<213>Zea mays mays  株  Pira
<400>131
ggcatggttc ttgacaagcg cattgggtct ttcaacattc ctcctgcatc tctctccact      60
tttgatgtaa tcagcgtcat catgtgggtc ccactctatg accgcatcct ggtgccacta     120
gctagaaaat tcactggaag ggagaagggt ttttctgagc tacagcggat gggaattgga     180
ttagtcctgt ccattctcgc gatggtatct gcagctctag ttgagttgaa gcgtttagag     240
attgccaggt ctgaaggtct cattcatgag aaggctgctg ttccaatgag cattctttgg     300
caaataccac aatatttctt ggtgggcgct gctgaggtgt ttacttgtat tggtcaagtt     360
gagttctttt acgatcaggc cccagatgcc atgaggagtt tatgtagtgc acttgcactt     420
attacagtct cactgggaaa ctatataagc tccatcatac tgacattggt gtcgtacatt     480
acaactcagg gaggagatcc tggatggatc cctgacaatc tgaat                     525
<210>132
<211>499
<212>DNA
<213>Zea mays mays  株  Sari
<400>132
accaagcaga gagagctaag aagggttcat tcttcaattg gttctacttc tgtataaata     60
taggttcatt catatcaggc actatgatag tgtggataca agataacact ggttggggaa    120
taggctttgc gattcctact atattcatgg cattagctat ttcattcttc ttctcagctt    180
caaataagta cagattccaa aaacctggtg ggagtccact cacaagagtg tgccaggtgg    240
ttatagcagc atttcgtaag tggcacattg aagtgccaca tgatacatct ctcctatatg    300
aagttgatgg ccaaacttca gcaattgaag gaagccggaa gctggagcac acaaatgagc    360
tcgagtaatt ctaattttct gcaatgcaat cacttcttta gtttcagtat catgtgatgc    420
aacatttatg gaatatttgg aaatgacagt acttatatgt cataaagaca ttgaacttca    480
ctgcaaagtt tttattatt                                                 499
<210>133
<211>607
<212>DNA
<213>Zea mays mays  株  Sari
<400>133
ttaggagact ttcaaattgc taatgtccta aacaacactt gtttgtgagt ttatgacaaa     60
gagtagtagt atgttgtagt tctacaagac atccgacaat agaaatagtg gctgccactt    120
aattctcaat actcactact cagcagtcaa tagtaatcca aattaatctg aaactccgtg    180
gaggaagcaa atgcaccgtg acacatgtta ctgtgtactt gtgatcttgt taaatgcttg    240
cttgtaaatg caacgattgt aactaagtaa cataacttaa ggctcaggag gaccagacac    300
atgttacttg cataattgta tttttttcaa gtatgttatg cctgtaagga gcttgatttg    360
tggatttcat atcttttatt gtgtggctac tataatattt tatctacctc tcttgtgtgt    420
aggttccttg atagagctgc tgttatctca tctgctgatc tgaagagtga atcctttacc    480
gacccatgga agctttgcac agttacccag gtggaagaat tgaagatcct aataagaatg    540
tttcccattt gggctactac tatcatattc agtgctgttt atgcccaaaa ctcttccatg    600
ttcatag                                                              607
<210>134
<211>520
<212>DNA
<213>Zea mays mays  株  Sari
<400>134
catggttctt gacaagcgca ttgggtcttt caacattcct cctgcatctc tctccacttt     60
tgatgtaatc agcgtcatca tgtgggtccc actctatgac cgcatcctgg tgccactagc    120
tagaaaattc actggaaggg agaagggttt ttctgagcta cagcggatgg gaattggatt    180
agtcctgtcc attctcgcga tggtatctgc agctctagtt gagttgaagc gtttagagat    240
tgccaggtct gaaggtctca ttcatgagaa ggctgctgtt ccaatgagca ttctttggca    300
aataccacaa tatttcttgg tgggcgctgc tgaggtgttt acttgtattg gtcaagttga    360
gttcttttac gatcaggccc cagatgccat gaggagttta tgtagtgcac ttgcacttat    420
tacagtctca ctgggaaact atataagctc catcatactg acattggtgt cgtacattac    480
aactcaggga ggagatcctg gatggatccc tgacaatctg                          520
<210>135
<211>543
<212>DNA
<213>Zea mays mays  株  Smena
<400>135
gacactgacc aagcagagag agctaagaag ggttcattct tcaattggtt ctacttctgt     60
ataaatatag gttcattcat atcaggcact atgatagtgt ggatacaaga taacactggt    120
tggggaatag gctttgcgat tcctactata ttcatggcat tagctatttc attcttcttc    180
tcagcttcaa ataagtacag attccaaaaa cctggtggga gtccactcac aagagtgtgc    240
caggtggtta tagcagcatt tcgtaagtgg cacattgaag tgccacatga tacatctctc    300
ctatatgaag ttgatggcca aacttcagca attgaaggaa gccggaagct ggagcacaca    360
aatgagctcg agtaattcta attttctgca atgcaatcac ttctttagtt tcagtatcat    420
gtgatgcaac atttatggaa tatttgggaa tgacagtact tatatgtcat aaagacattg    480
aacttcactg caaagttttt attatttcaa cttgaggata ctggaaaatt agtacataaa    540
tac                                                                  543
<210>136
<211>443
<212>DNA
<213>Zea mays mays  株  Smena
<400>136
aattaatctg aaactccgtg gaggaagcaa atgcaccgtg acacatgtta ctgtgtactt     60
gtgatcttgt taaatgcttg cttgtaaatg caacgattgt aactaagtaa cataacttaa    120
ggctcaggag gaccagacac atgttacttg cataattgta tttttttcaa gtatgttatg    180
cctgtaagga gcttgatttg tggatttcat atcttttatt gtgtggctac tataatattt    240
tatctacctc tcttgtgtgt aggttccttg atagagctgc tgttatctca tctgctgatc    300
tgaagagtga atcctttacc gacccatgga agctttgcac agttacccag gtggaagaat    360
tgaagatcct aataagaatg tttcccattt gggctactac tatcatattc agtgctgttt    420
atgcccaaaa ctcttccatg ttc                                            443
<210>137
<211>523
<212>DNA
<213>Zea mays mays  株  Smena
<400>137
gcatggttct tgacaagcgc attgggtctt tcaacattcc tcctgcatct ctctccactt     60
ttgatgtaat cagcgtcatc atgtgggtcc cactctatga ccgcatcctg gtgccactag    120
ctagaaaatt cactggaagg gagaagggtt tttctgagct acagcggatg ggaattggat    180
tagtcctgtc cattctcgcg atggtatctg cagctctagt tgagttgaag cgtttagaga    240
ttgccaggtc tgaaggtctc attcatgaga aggctgctgt tccaatgagc attctttggc    300
aaataccaca atatttcttg gtgggcgctg ctgaggtgtt tacttgtatt ggtcaagttg    360
agttctttta cgatcaggcc ccagatgcca tgaggagttt atgtagtgca cttgcactta    420
ttacagtctc actgggaaac tatataagct ccatcatact gacattggtg tcgtacatta    480
caactcaggg aggagatcct ggatggatcc ctgacaatct gaa                      523
<210>138
<211>488
<212>DNA
<213>Zea mays mays  株  W22
<400>138
gggtctttca acattcctcc tgcatctctc tccacttttg atgtaatcag cgtcatcatg     60
tgggtcccac tctatgaccg catcctggtg ccactagcta gaaaattcac tggaagggag    120
aagggttttt ctgagctaca gcggatggga attggattag tcctgtccat tctcgcgatg    180
gtatctgcag ctctagttga gttgaagcgt ttagagattg ccaggtctga aggtctcatt    240
catgagaagg ctgctgttcc aatgagcatt ctttggcaaa taccacaata tttcttggtg    300
ggcgctgctg aggtgtttac ttgtattggt caagttgagt tcttttacga tcaggcccca    360
gatgccatga ggagtttatg tagtgcactt gcacttatta cagtctcact gggaaactat    420
ataagctcca tcatactgac attggtgtcg tacattacaa ctcagggagg agatcctgga    480
tggatccc                                                             488
<210>139
<211>516
<212>DNA
<213>Zea mays mays  株  Benz
<400>139
atggttcttg acaagcgcat tgggtctttc aacattcctc ctgcatctct ctccactttt     60
gatgtaatca gcgtcatcat gtgggtccca ctctatgacc gcatcctggt gccactagct    120
agaaaattca ctggaaggga gaagggtttt tctgagctac agcggatggg aattggatta    180
gtcctgtcca ttctcgcgat ggtatctgca gctctagttg agttgaagcg tttagagatt    240
gccaggtctg aaggtctcat tcataagaag gctgctgttc caatgagcat tctttggcaa    300
ataccacaat atttcttggt gggcgctgct gaggtgttta cttgtattgg tcaagttgag    360
ttcttttacg atcaggcccc agatgccatg aggagtttat gtagtgcact tgcacttatt    420
acagtctcac tgggaaacta tataagctcc atcatactga cattggtgtc gtacattaca    480
actcagggag gagatcctgg atggatccct gacaat                              516
<210>140
<211>385
<212>DNA
<213>Zea mays teosinte  株  BK4
<400>140
tgacactgac caagcagaga gagctaagaa gggttcattc ttcaattggt tctacttctg     60
tataaatata ggttcattca tatcaggcac tatgatagtg tggatacaag ataacactgg    120
ttggggaata ggctttgcga ttcctactat attcatggca ttagctattt cattcttctt    180
ctcagcttca aataagtaca gattccaaaa acctggtggg agtccactca caagagtgtg    240
ccaggtggtt atagcagcat ttcgtaagtg gcacattgaa gtgccacatg atacatctct    300
cctatatgaa gttgatggcc aaacttcagc aattgaagga agccggaagc tggagcacac    360
aaatgagctc gagtaattct  aattt                                         385
<210>141
<211>613
<212>DNA
<213>Zea mays teosinte  株  BK4
<400>141
aaagctgcct tttaggagac tttcaaattg ctaatgtcct aaacaacact tgtttgtgag     60
tttatgacaa agagtagtag tatgttgtag ttctacaaga catccgacaa tagaaatagt    120
ggctgccact taattctcaa tactcactac tcagcagtca atagtaatcc aaattaatct    180
gaaactccgt ggaggaagca aatgcaccgt gacacatgtt actgtgtact tgtgatcttg    240
ttaaatgctt gcttgtaaat gcaacgattg taactaagta acataactta aggctcagga    300
ggaccagaca catgttsctt gcataattgt atttttttca agtatgttat gcctgtaagg    360
agcttgattt gtggatttca tatcttttat tgtgtggcta ctataatatt ttatctacct    420
ctcttgtgtg taggttcctt gatagagctg ctgttatctc atctgctgat ctgaagagtg    480
aatcctttac cgacccatgg aagctttgca cagttaccca ggtggaagaa ttgaagatcc    540
taataagaat gtttcccatt tgggctacta ctatcatatt cagtgctgtt tatgcccaaa    600
actcttccat gtt                                                       613
<210>142
<211>462
<212>DNA
<213>Zea mays teosinte  株  BK4
<400>142
attgggtctt tcaacattcc tcctgcatct ctctccactt ttgatgtaat cagcgtcatc     60
atgtgggtcc cactctatga ccgcatcctg gtgccactag ctagaaaatt cactggaagg    120
gagaagggtt tttctgagct acagcggatg ggaattggat tagtcctgtc cattctcgcg    180
atggtatctg cagctctagt tgagttgaag cgtttagaga ttgccaggtc tgaaggtctc    240
attcatgaga aggctgctgt tccaatgagc attctttggc aaataccaca atatttcttg    300
gtgggcgctg ctgaggtgtt tacttgtatt ggtcaagttg agttctttta cgatcaggcc    360
ccagatgcca tgaggagttt atgtagtgca cttgcactta ttacagtctc actgggaaac    420
tatataagct ccatcatact gacattggtg tcgtacatta ca                       462
<210>143
<211>556
<212>DNA
<213>Zea mays teosinte  株  Wilkes
<400>143
agagagctaa gaagggttca ttcttcaatt ggttctactt ctgtataaat ataggttcat     60
tcatatcagg cactatgata gtgtggatac aagataacac tggttgggga ataggctttg    120
cgattcctac tatattcatg gcattagcta tttcattctt cttctcagct tcaaataagt    180
acagattcca aaaacctggt gggagtccac tcacaagagt gtgccaggtg gttatagcag    240
catttcgtaa gtggcacatt gaagtgccac atgatacatc tctcctatat gaagttgatg    300
gccaaacttc agcaattgaa ggaagccgga agctggagca cacaaatgag ctcgagtaat    360
tctaattttc tgcaatgcaa tcacttcttt agtttcagta tcatgtgatg caacatttat    420
ggaatatttg gaaatgacag tacttatatg tcataaagac attgaacttc actgcaaagt    480
ttttattatt tcaacttgag gatactggaa aattagtaca taaataccat gaaaaagaat    540
taggaattat tgatag                                                    556
<210>144
<211>552
<212>DNA
<213>Zea mays teosinte  株  Wilkes
<400>144
ctaaacaaca cttgtttgtg agtttatgac aaagagtagt agtatgttgt agttctacaa     60
gacatccgac aatagaaata gtggctgcca cttaattctc aatactcact actcagcagt    120
caatagtaat ccaaattaat ctgaaactcc gtggaggaag caaatgcacc gtgacacatg    180
ttactgtgta cttgtgatct tgttaaatgc ttgcttgtaa atgcaacgat tgtaactaag    240
taacataact taaggctcag gaggaccaga cacatgttac ttgcataatt gtattttttt    300
caagtatgtt atgcctgtaa ggagcttgat ttgtggattt catatctttt attgtgtggc    360
tactataata ttttatctac ctctcttgtg tgtaggttcc ttgatagagc tgctgttatc    420
tcatctgctg atctgaagag tgaatccttt accgacccat ggaagctttg cacagttacc    480
caggtggaag aattgaagat cctaataaga atgtttccca tttgggctac tactatcata    540
ttcagtgctg tt                                                        552
<210>145
<211>511
<212>DNA
<213>Zea mays teosinte  株  Wilkes
<400>145
gcattgggtc tttcaacatt cctcctgcat ctctctccac ttttgatgta atcagcgtca     60
tcatgtgggt cccactctat gaccgcatcc tggtgccact agctagaaaa ttcactggaa    120
gggagaaggg tttttctgag ctacagcgga tgggaattgg attagtcctg tccattctcg    180
cgatggtatc tgcagctcta gttgagttga agcgtttaga gattgccagg tctgaaggtc    240
tcattcatga gaaggctgct gttccaatga gcattctttg gcaaatacca caatatttct    300
tggtgggcgc tgctgaggtg tttacttgta ttggtcaagt tgagttcttt tacgatcagg    360
ccccagatgc catgaggagt ttatgtagtg cacttgcact tattacagtc tcactgggaa    420
actatataag ctccatcata ctgacattgg tgtcgtacat tacaactcag ggaggagatc    480
ctggatggat ccctgacaat ctgaatgaag g                                   511

Claims (78)

1.一种方法,用于鉴别编码驯化生物的多肽的多核苷酸序列,其中与该驯化生物野生祖先相比该多肽与或者可能与所述驯化生物的产量提高有关,该方法包括下列步骤:
a)将该驯化生物的多肽编码核苷酸序列与该野生祖先的多肽编码核苷酸序列相比较;和
b)选择驯化生物中的一种多核苷酸序列,与野生祖先中的相应序列相比,该序列含有核苷酸改变,其中这种改变进化上显著,从而鉴别驯化生物的多核苷酸序列。
2.权利要求1的方法,其中与产量提高有关的多肽是EG307或EG1117多肽。
3.一种生产转染的植物细胞或转基因植物的方法,包括下列步骤:
a)转染一种植物细胞,使之含有一种异源DNA区段,该区段编码一种多肽,并且来源于不是该细胞天然的EG307和EG1117多核苷酸;其中该多核苷酸与能够有效用于转基因蛋白质表达的启动子有效连接;
b)任选地,在由所述细胞再生转基因植物的条件下生长并保持该细胞;
c)任选地,在该DNA表达的条件下生长该转基因植物,由此该植物中的EG307或EG1117多肽的总量提高。
4.权利要求3的方法,它还包括获得并生长该转基因植物的其它后代的步骤,该植物中含有所述异源DNA区段,其中该异源DNA区段表达。
5.植物细胞,其含有编码EG307或EG1117多肽的异源DNA。
6.一种转基因植物的繁殖材料,其含有根据权利要求5的转基因植物细胞。
7.一种转基因植物,其含有编码在植物组织中表达的EG307或EG1117多肽的异源DNA。
8.一种分离的多核苷酸,其含有一个启动子,该启动子与编码植物组织中EG307或EG1117基因的多核苷酸有效连接。
9.权利要求8的分离的多核苷酸,其中该多核苷酸是一种重组多核苷酸。
10.权利要求8的方法,其中所述启动子是EG307或EG1117基因天然的启动子。
11.一种制备转染的细胞的方法,其包括:
a)鉴定驯化植物的祖先中一种进化上显著的EG307或EG1117多核苷酸,或驯化植物中相应的多核苷酸;
b)使用该EG307或EG1117多核苷酸鉴定一种非多肽编码序列,其可以是转录或翻译调节元件、增强子、内含子或其它5′或3′侧翼序列;
c)装配一种构建体,其含有与编码报道蛋白的多核苷酸有效连接的非多肽编码序列;和
d)用该构建体转染宿主细胞。
12.根据权利要求11的方法产生的经转染的细胞。
13.一种制备转基因植物的方法,包括权利要求11的方法,其中该宿主细胞是一种植物细胞,该方法还包括在由所述细胞再生为转基因植物的条件下生长并保持该细胞的步骤。
14.一种通过权利要求12的方法产生的转基因植物。
15.一种方法,用于鉴定可调节进化上显著的EG307或EG1117多核苷酸的非多肽编码区的功能的试剂,该方法包括使权利要求11的转染的宿主细胞接触至少一种候选试剂,其中根据调节该报道多核苷酸的转录或翻译的能力鉴定该试剂。
16.一种用权利要求15的方法鉴定的试剂。
17.一种方法,用于鉴定可调节进化上显著的EG307或EG1117多核苷酸的非多肽编码区的功能的试剂,该方法包括使权利要求13的转基因植物接触至少一种候选试剂,其中根据调节该报道多核苷酸的转录或翻译的能力鉴定该试剂。
18.一种用权利要求17的方法鉴定的试剂。
19.一种经转染的宿主细胞,包括用一种构建体转染的宿主细胞,该构建体含有来自进化上显著的EG307或EG1117多核苷酸的内含子多核苷酸或启动子、增强子,或其任意组合,与编码一种报道蛋白的多核苷酸有效连接。
20.一种方法,用于鉴定可调节产量的一种试剂,该方法包括使至少一种候选试剂接触含有EG307或EG1117基因的植物或细胞,其中根据调节产量的能力鉴定该试剂。
21.权利要求20的方法,其中植物或细胞用编码EG307或EG1117基因的多核苷酸转染。
22.一种按照权利要求20的方法鉴定的试剂。
23.权利要求20的方法,其中所述鉴定的试剂通过调节编码多肽的多核苷酸的功能调节产量。
24.权利要求20的方法,其中所述鉴定的试剂通过调节多肽的功能调节产量。
25.一种导致植物产量提高的方法,包括:
a)产生一种转染的植物细胞,其含有编码EG307或EG1117多肽的异源DNA,籍此EG307或EG1117在该植物细胞中表达;和
b)由转染的植物细胞生长为转基因植物,其中EG307或EG1117转基因在该转基因植物中表达。
26.权利要求25的方法,其中所述转基因处于适于转基因受控表达的调节序列控制下。
27.一种生产EG307或EG1117多肽的方法,其包括:
a)提供一种细胞,该细胞用为了在细胞中表达而定位的编码EG307或EG1117多肽的多核苷酸转染;
b)在表达该多核苷酸的条件下培养转染的细胞;和
c)分离EG307或EG1117多肽。
28.权利要求25的方法,其中编码EG307或EG1117基因的异源DNA处于导致EG307或EG1117基因组成型表达的启动子控制下。
29.权利要求25的方法,其中编码EG307或EG1117基因的异源DNA处于导致EG307或EG1117基因受控表达的启动子控制下。
30.权利要求29的方法,其中使用一种组织特异性或细胞类型特异性启动子,或者使用引入外部信号或试剂(如化学信号或试剂)可以激活的启动子,表达EG307或EG1117基因。
31.一种从植物细胞中分离与产量有关的基因或其片段的方法,包括:
a)提供植物细胞多核苷酸的样品;
b)提供与EG307或EG1117基因的保守区具有序列同源性的一对寡核苷酸;
c)在适于聚合酶链反应介导的多核苷酸扩增的条件下,寡核苷酸对与植物细胞多核苷酸样品结合;和
d)分离扩增的与产量有关多核苷酸或其片段。
32.一种按照权利要求31的方法分离的与产量有关的植物多核苷酸。
33.一种分离与产量有关的多核苷酸的方法,包括:
a)提供选自基因组植物细胞DNA和重组植物细胞文库多核苷酸的多核苷酸制品;
b)在可以检测具有50%或更高序列同一性的多核苷酸的杂交条件下,使该制品接触EG307或EG1117寡核苷酸;和
c)通过与EG307或EG1117寡核苷酸结合分离与产量有关的多核苷酸。
34.权利要求33的方法,其中EG307或EG1117寡核苷酸被可检测地标记,通过与可检测标记结合分离与产量有关的基因。
35.权利要求33的方法,其中EG307或EG1117寡核苷酸的长度至少为12个核苷酸。
36.权利要求33的方法,其中EG307或EG1117寡核苷酸的长度至少为30个核苷酸。
37.一种鉴定与植物产量有关的基因的方法,包括:
a)提供一种植物组织样品;
b)向植物组织样品中导入一种候选的与植物产量有关的基因;
c)在植物组织样品内表达候选的与植物产量有关的基因;和
d)确定植物组织样品是否显示产量反应改变,籍此反应的改变鉴定与植物产量有关的基因。
38.一种根据权利要求37的方法分离的与植物产量有关的基因。
39.一种分离的多核苷酸,其选自:
a)一种多核苷酸,其选自:SEQ ID NO:92,SEQ ID NO:93,SEQID NO:94,SEQ ID NO:96,SEQ ID NO:97,和SEQ ID NO:98;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
40.一种分离的多核苷酸,其选自:
a)一种多核苷酸,其选自:SEQ ID NO:100,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:110,SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:116,和SEQ ID NO:117;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
41.一种分离的多核苷酸,其选自:
a)一种多核苷酸,其选自:SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:124,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:128,SEQ ID NO:129,SEQ ID NO:130,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147,SEQ ID NO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:154,和SEQ IDNO:155;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
42.一种分离的多核苷酸,其选自:
a)一种多核苷酸,其选自:SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162,SEQ ID NO:163,SEQ ID NO:165,SEQ ID NO:166,SEQ ID NO:167,和SEQ IDNO:168;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
43.一种分离的多肽,其选自:
a)由选自下列的多核苷酸编码的一种多肽:SEQ ID NO:92,SEQID NO:93,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:97,和SEQID NO:98;和
b)由一种多核苷酸编码的一种多肽,该多核苷酸与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
44.一种分离的多肽,其选自:
a)由选自下列的多核苷酸编码的一种多肽:SEQ ID NO:100,SEQID NO:101,SEQ ID NO:103,SEQ ID NO:104,SEQ ID NO:106,SEQID NO:107,SEQ ID NO:109,SEQ ID NO:110,SEQ ID NO:112,SEQID NO:113,SEQ ID NO:114,SEQ ID NO:116,和SEQ ID NO:117;和
b)由一种多核苷酸编码的一种多肽,该多核苷酸与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
45.一种分离的多肽,其选自:
a)由选自下列的多核苷酸编码的一种多肽:SEQ ID NO:119,SEQID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQID NO:124,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:128,SEQID NO:129,SEQ ID NO:130,SEQ ID NO:131,SEQ ID NO:133,SEQID NO:135,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:144,SEQID NO:145,SEQ ID NO:146,SEQ ID NO:147,SEQ ID NO:149,SEQID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:154,和SEQ ID NO:155;和
b)由一种多核苷酸编码的一种多肽,该多核苷酸与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
46.一种分离的多肽,其选自:
a)由选自下列的多核苷酸编码的一种多肽:SEQ ID NO:157,SEQID NO:158,SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162,SEQID NO:163,SEQ ID NO:165,SEQ ID NO:166,SEQ ID NO:167,和SEQ ID NO:168;和
b)由一种多核苷酸编码的一种多肽,该多核苷酸与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
47.一种方法,用于鉴定编码野生祖先或驯化生物的多肽的多核苷酸序列,其中该多肽与或者可能与该野生祖先或驯化生物的经济生产力的提高有关,该方法包括下列步骤:
a)比较该野生祖先与该驯化生物的多肽编码核苷酸序列;和
b)选择驯化生物或野生祖先中的一种多核苷酸序列,分别与野生祖先或驯化生物中的相应序列相比,其含有核苷酸改变,其中这种改变是进化中性或,有积极的进化意义,从而鉴定编码与经济生产力提高有关的一种多肽的多核苷酸。
48.一种方法,用于鉴定编码驯化生物的野生祖先的一种多肽的多核苷酸序列,其中与驯化生物相比,该多肽与或者可能与该驯化生物的野生祖先中的独特、增强或改变的应激抗性性状有关,该方法包括下列步骤:
a)将该驯化生物的多肽编码核苷酸序列与该野生祖先的多肽编码核苷酸序列比较;和
b)选择野生祖先中的一种多核苷酸序列,与驯化生物中的相应序列相比,该序列含有核苷酸改变,其中这种改变是进化中性的,从而鉴定野生祖先的多核苷酸序列。
49.权利要求48的方法,其中所述驯化生物是一种植物,选自玉米、水稻、西红柿、马铃薯和其祖先已知的其它驯化植物。
50.权利要求49的方法,其中所述驯化植物是玉米,所述野生祖先是玉米草。
51.权利要求48的方法,其中所述驯化生物的蛋白质编码的核苷酸序列对应于cDNA。
52.权利要求48的方法,其中所述核苷酸改变是一种非同义置换。
53.权利要求48的方法,其中驯化生物是一种植物,应激抗性性状选自抗旱性、抗病性、抗虫性、高盐水平抗性和具有商业意义的其它应激抗性性状。
54.一种方法,用于鉴定可调节驯化生物的野生祖先中的应激抗性性状的试剂,该方法包括使至少一种候选试剂接触野生祖先、驯化生物或表达权利要求48中鉴定的多核苷酸序列的细胞或转基因生物,其中根据调节多核苷酸的功能或鉴定的多核苷酸序列所编码之多肽的功能的能力鉴定该试剂。
55.一种方法,通过施用权利要求54的试剂调节驯化生物的野生祖先中的应激抗性。
56.一种方法,用于为驯化生物中多核苷酸序列编码的多肽序列鉴定一种试剂,该多核苷酸序列对应于权利要求48的野生型祖先应激抗性多核苷酸序列,该方法包括使至少一种候选试剂接触驯化生物、祖先生物或表达多核苷酸序列的细胞或转基因生物,其中根据调节多肽序列的功能的能力鉴定该试剂。
57.一种方法,通过施用权利要求56的试剂调节驯化生物中的应激抗性。
58.一种方法,用于鉴定驯化生物的野生祖先的多肽编码多核苷酸序列中的进化中性改变,该方法包括下列步骤:
a)将该野生祖先的多肽编码多核苷酸序列与该驯化生物的相应序列比较;和
b)选择该驯化生物中的一种多核苷酸序列,与野生祖先的相应序列相比,该序列含有核苷酸改变,其中这种改变是进化中性的,该多核苷酸与驯化生物的野生祖先的应激抗性性状有关,籍此鉴定多核苷酸中进化中性的改变。
59.权利要求58的方法,其中所述驯化生物是一种植物,选自玉米、水稻、西红柿、马铃薯和其祖先已知的其它驯化植物。
60.权利要求58的方法,其中所述驯化植物是玉米,所述野生祖先是玉米草。
61.权利要求58的方法,其中所述驯化生物的蛋白质编码核苷酸序列对应于cDNA。
62.权利要求58的方法,其中所述核苷酸改变是一种非同义置换。
63.权利要求58的方法,其中驯化生物是一种植物,相关性状选自抗旱性、抗病性、抗虫性、高盐水平抗性和具有商业意义的其它应激抗性性状。
64.一种方法,用于驯化生物之野生祖先的多肽编码核苷酸序列与驯化生物的多肽编码序列之间的大规模序列比较,其中野生祖先生物多肽提供或者可能提供,与驯化生物相比,在野生祖先中独特、增强或改变的应激抗性性状,该方法包括:
a)根据序列同源性排比野生祖先序列与来自驯化生物的相应序列;和
b)鉴定驯化生物序列或野生序列内分别与来自野生祖先或驯化生物的同源序列相比的任何核苷酸改变。
65.权利要求64的方法,其中所述驯化生物是一种植物,选自玉米、水稻、西红柿、马铃薯和其祖先已知的其它驯化植物。
66.权利要求65的方法,其中所述驯化植物是玉米,所述野生祖先是玉米草。
67.权利要求64的方法,其中所述驯化种的蛋白质编码核苷酸序列对应于cDNA。
68.一种方法,用于将进化中性的核苷酸改变与驯化生物的野生祖先中独特、增强或改变的应激抗性性状相关联,该方法包括:
a)鉴定根据权利要求48的一种核苷酸序列;和
b)分析驯化生物或祖先生物中存在或不存在所鉴定的序列之功能效应。
69.一种制备转染的植物细胞或转基因植物的方法,包括下列步骤:
a)转化一种植物细胞,使之含有编码权利要求48的野生祖先的应激抗性多肽的多核苷酸,其中该多核苷酸与能够有效用于转基因蛋白质表达的启动子有效连接;
b)任选地在由所述细胞再生为转基因植物的条件下培养并保持该细胞。
70.通过权利要求69的方法产生的转染细胞。
71.通过权利要求69的方法产生的转基因植物。
72.一种分离的多核苷酸,其选自:
a)一种多核苷酸,选自:SEQ ID NO:1,SEQ ID NO:91,SEQID.NO:2,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:14,SEQ IDNO:15,SEQ ID NO:17,和SEQ ID NO:18;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
73.一种分离的多核苷酸,其选自:
a)一种多核苷酸,选自:SEQ ID NO:20,SEQ ID NO:21,SEQ IDNO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:27,SEQ IDNO:28,SEQ ID NO:29,和SEQ ID NO:90;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
74.一种分离的多核苷酸,其选自:
a)一种多核苷酸,选自:SEQ ID NO:33,SEQ ID NO:34,SEQ IDNO:35,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:45,SEQ IDNO:46,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:50,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ IDNO:63,和SEQ ID NO:64;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
75.一种分离的多核苷酸,其选自:
a)一种多核苷酸,选自:SEQ ID NO:66,SEQ ID NO:67,SEQ IDNO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:73,SEQ IDNO:74,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:59,和SEQ IDNO:78;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
76.一种分离的多核苷酸,其选自:
a)一种多核苷酸,选自:SEQ ID NO:80,SEQ ID NO:81,和SEQID NO:82;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
77.一种分离的多核苷酸,其选自:
a)一种多核苷酸,选自SEQ ID NO:84和SEQ ID NO:85;和
b)一种多核苷酸,它与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
78.一种分离的多肽,其选自:
a)由选自下列的一种多核苷酸编码的一种多肽:SEQ ID NO:1,SEQ ID NO:91,SEQ ID.NO:2,SEQ ID NO:4,SEQ ID NO:5,SEQID NO:7,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ IDNO:14,SEQ ID NO:15,SEQ ID NO:17,和SEQ ID NO:18;和
b)由一种多核苷酸编码的一种多肽,该多核苷酸与a)的多核苷酸有至少85%的同源性,导致与a)的多核苷酸基本相同的产量。
CNA038048477A 2002-01-16 2003-01-16 鉴定驯化的植物和动物中进化上显著的多核苷酸和多肽序列改变的方法 Pending CN1630731A (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US34908802P 2002-01-16 2002-01-16
US60/349,088 2002-01-16
US34966102P 2002-01-17 2002-01-17
US60/349,661 2002-01-17
US10/079,042 2002-02-19
US10/079,042 US7252966B2 (en) 1999-01-29 2002-02-19 EG307 polynucleotides and uses thereof
US36854102P 2002-03-29 2002-03-29
US60/368,541 2002-03-29

Publications (1)

Publication Number Publication Date
CN1630731A true CN1630731A (zh) 2005-06-22

Family

ID=27617766

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038048477A Pending CN1630731A (zh) 2002-01-16 2003-01-16 鉴定驯化的植物和动物中进化上显著的多核苷酸和多肽序列改变的方法

Country Status (9)

Country Link
EP (1) EP1501942A4 (zh)
JP (1) JP2005518199A (zh)
KR (1) KR20040081139A (zh)
CN (1) CN1630731A (zh)
AU (2) AU2003217221B2 (zh)
BR (1) BR0306968A (zh)
CA (1) CA2473555A1 (zh)
IL (1) IL162897A0 (zh)
WO (1) WO2003062382A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006230352A1 (en) * 2005-03-29 2006-10-05 Evolutionary Genomics Llc EG1117 and EG307 polynucleotides and uses thereof
US20080256659A1 (en) * 2005-09-02 2008-10-16 Evolutionary Genomics, Inc. Eg8798 and Eg9703 Polynucleotides and Uses Thereof
CN102888398B (zh) * 2011-07-22 2014-03-05 中国农业科学院生物技术研究所 转基因水稻品系Bar68-1的外源插入片段的旁侧序列及其应用
CN102934548B (zh) * 2011-08-15 2014-07-02 东北农业大学 辅助鉴定抗旱玉米的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6245969B1 (en) * 1997-06-24 2001-06-12 Joanne Chory Receptor kinase, Bin1
AU769931B2 (en) * 1998-01-30 2004-02-12 Evolutionary Genomics Llc Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions
US6274319B1 (en) * 1999-01-29 2001-08-14 Walter Messier Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
DE60036645T2 (de) * 1999-08-05 2008-07-17 Evolutionary Genomics LLC, Lafayette Methoden zur identifizierung evolutionär signifikanter änderungen in polynukleotid- und polypeptidsequenzen in domestizierten pflanzen und tieren

Also Published As

Publication number Publication date
WO2003062382A3 (en) 2004-12-09
EP1501942A2 (en) 2005-02-02
EP1501942A4 (en) 2006-06-07
AU2003217221B2 (en) 2008-11-27
WO2003062382A2 (en) 2003-07-31
BR0306968A (pt) 2006-04-11
CA2473555A1 (en) 2003-07-31
AU2009200805A1 (en) 2009-03-26
IL162897A0 (en) 2005-11-20
JP2005518199A (ja) 2005-06-23
KR20040081139A (ko) 2004-09-20

Similar Documents

Publication Publication Date Title
CN101068929A (zh) 参与植物纤维发育的多核苷酸和多肽和使用它们的方法
US20080220503A1 (en) Screening method for genes of brewing yeast
US20060046253A1 (en) Method for analyzing genes of industrial yeasts
CN1933723A (zh) 玉米植株mon88017和组合物以及检测它们的方法
CN1708588A (zh) Cot102杀虫棉花
CN1849064A (zh) Qtl“随时定位”方法
CA2621202A1 (en) Method for analyzing genes of industrial yeasts
CN111172173B (zh) 降低玉米株高或延迟开花的方法
CN108822194B (zh) 一个植物淀粉合成相关蛋白OsFLO10及其编码基因与应用
CN111235180A (zh) 缩短玉米花期的方法
CN108642067A (zh) 一种水稻胚乳粉质相关的基因OsHsp70cp-2及其编码蛋白质和应用
CN1496410A (zh) 方法
CN112011553A (zh) 一种脂质转运蛋白及其编码基因与应用
CN1630731A (zh) 鉴定驯化的植物和动物中进化上显著的多核苷酸和多肽序列改变的方法
CN1481391A (zh) 编码一种可调控拟南芥叶子寿命的f-盒蛋白的新基因及其突变基因
CN1930292A (zh) 硼酸抗性给予蛋白质及其基因
CN1814760A (zh) 水稻抗病相关基因OsDR8
CN110407922B (zh) 水稻耐冷基因qSCT11及其应用
CN1318106A (zh) 来源于拟南芥属的尿嘧啶通透酶用作除草剂靶基因
CN112813067A (zh) 通过抑制sd1基因的表达降低四倍体野生稻株高的方法
US20030148292A1 (en) Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
CN1886514A (zh) 用于增强植物胁迫耐受性的方法
CN1795269A (zh) 用于将需要的性状迅速赋予生物的方法和系统
CN108624569A (zh) 小麦籽粒脂肪氧化酶新基因及其应用
CN1898382A (zh) 基因组dna片段的筛选方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20050622