CN1688694A - 广谱抗性基因Pi2的克隆与表征 - Google Patents

广谱抗性基因Pi2的克隆与表征 Download PDF

Info

Publication number
CN1688694A
CN1688694A CN 03824033 CN03824033A CN1688694A CN 1688694 A CN1688694 A CN 1688694A CN 03824033 CN03824033 CN 03824033 CN 03824033 A CN03824033 A CN 03824033A CN 1688694 A CN1688694 A CN 1688694A
Authority
CN
China
Prior art keywords
leu
ser
ile
glu
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 03824033
Other languages
English (en)
Inventor
王国梁
瞿绍洪
周波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ohio State University
Original Assignee
Ohio State University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ohio State University filed Critical Ohio State University
Publication of CN1688694A publication Critical patent/CN1688694A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

提供了用来提高或产生植物对植物害虫的抗病性的组合物和方法。用本发明的一种新型水稻Pi2-样抗病性基因转化植物可提高该植物的抗病性。也提供了抗病性提高的转化的植物、植物细胞、组织和种子。

Description

广谱抗性基因Pi2的克隆与表征
                      发明领域
本发明一般地涉及植物分子生物学。更具体而言,涉及核酸和调节核酸在植物中表达的方法,以及为了提高抗病性用基因转化植物。
                      发明背景
由真菌Magnaporthe grisea引起的稻瘟病是最具破坏性的水稻病之一,在世界上大多数水稻生长地区都有发生。在植物损害方面,稻瘟病在水稻植物发育的营养阶段通常导致叶枯(leaf blast),当植物在生殖阶段感染时导致不育(圆锥花序和结节枯萎(panicle and node blast))。后一种影响能够导致产量和质量显著下降,估计造成农民经济损失每年大约50亿美元(Moffat(1994)Science 265:1804-1805)。
因为稻农的经济来源通常有限,最常见的是使用显示自然抗病性的水稻植物栽培种实现稻瘟病的控制。然而,这些栽培种显示的抗病性通常不稳定,栽培种显示的抗性只在广泛耕种少数几季后即显示敏感性。尽管具有这种不稳定性,但是使用抗性栽培种仍然是最经济、有效的控制稻瘟病的方法。因此,仍然需要这些抗病栽培种。
尽管抗性栽培种是自然产生的,但是最近的研究集中于产生或改良高抗病性植物的遗传学方法。因此在最近40年,为了发展培育长期抗性栽培种所需的方法,水稻遗传学家和育种家研究了稻瘟病抗性种质的遗传学。稻瘟病抗性的遗传分析方法始于二十世纪六十年代初期,当时Goto为日本的M.grisea种建立了不同的系统(Ou(1985)Rice Disease第二版(Commonwealth Mycological Institute,Slough,UK)。
特别重要的一种稻瘟病抗性基因是Pi2基因,它显示对稻瘟病分离株不同群体的高效广谱抗性,因此在使用十年后,在许多水稻耕种地区仍然有效。尽管该基因在水稻基因组中的位置已经确定(Yu等人(1991)Theor.Appl.Genet.81:471-476;Liu等人(2002)Mol.Genet.Genom.267:472-480),但是它的DNA序列仍然不知道。因为产生或提高抗病性的技术依赖于对这些序列的了解,所以非常需要获得Pi2基因的实际DNA序列。
                      发明概述
提供了产生或提高植物害虫抗性的组合物和方法。组合物是从水稻中克隆的新Pi2-样抗病性基因同源物的核苷酸序列,以及它们编码的蛋白质或部分长度蛋白质或多肽的氨基酸序列。本发明的方法包括用这些新抗病性Pi2-样基因同源物之一稳定地转化一种植物,其中该基因与一个能够引导核苷酸编码序列在植物细胞中表达的启动子有效连接。通过与侵入的植物病原体释放到植物内的互补的植物病原体毒力基因产物相互作用,新核苷酸序列的表达使植物具有抗病性。本发明的方法可用于控制植物害虫,包括真菌病原体、病毒、线虫、昆虫等。
另外还提供了转化的植物和种子,以及产生这些植物和种子的方法。
                      附图简述
图1显示Pi2基因座的物理图谱。TAC和BAC克隆用线条显示。BAC70、TAC40和TAC10克隆用来进行测序。引物NIP、NBS2、NBS4和BAC6F在相应BAC和TAC克隆上的位置在BAC/TAC重叠群上方显示。
图2A、B显示Pi2基因座的遗传和物理图谱。A.在Pi2遗传作图中使用的标记在方框中显示,用箭头与相应的基因组序列相连,相应标记与Pi2之间的遗传距离在标记上方显示。B.Pi2区中的NBS/LRR基因簇。位于NBS/LRR基因簇上游的NIP基因显示为最左边的阴影框。6个NBS/LRR基因(NBS1-NBS6)按照它们在基因组序列中出现的顺序命名,分别显示为图中用NBS1-NBS6标记的6个方框。所有这些基因的转录方向都在基因名称下方用箭头表示。基因NBS1-NBS6的外显子显示为淡影线方框;位于NBS3基因左手部分的深影线方框代表该基因中的反转录子插入。
图3显示克隆NBS2的完整编码序列(CDS)的示意图。
图4显示NBS/LRR基因在Pi9和Pi2基因座处的比对。基因组序列用粗体字符串区别,NBS/LRR基因用实心圆形区别。Pi2与Pi9基因座之间的直向同源基因用双箭头直线表示。
图5显示NBS1、NBS2、NBS4、NBS6和克隆的稻瘟病抗性基因Pib的预测氨基酸序列之间的多重蛋白质序列比对。
图6显示NBS2(Pi2)基因内的保守NB-ARC和LRR结构域。该基因中存在一个NB-ARC结构域,从约氨基酸144到约氨基酸465,而该基因中也存在一个LRR结构,从约氨基酸534到约氨基酸951。
                      发明详述
本发明的组合物包含与抗病性有关的Pi2和相关(Pi2-样)基因。具体而言,本发明提供分离的核酸分子,其包含编码SEQ ID NOs:2、4、6、8、10和12所示氨基酸序列的核苷酸序列。还提供具有此处所述(例如SEQ ID NOs:1、3、5、7、9和11所示)核酸分子编码的氨基酸序列的多肽。
本发明公开了NBS1-NBS6的核苷酸序列,分别是SEQ ID NOs:1、3、5、7、9和11。本发明也公开了NBS1-6的相应的氨基酸序列,分别为SEQ ID NOs:2、4、6、8、10和12。SEQ ID NO:13公开了实施例3获得的Pi2区的99,090bp连续序列。SEQ ID NOs:14和15分别对应于实施例6的cDNA-45和cDNA-21;即,对应于NBS4基因的两个部分测序的3′片段,它们延伸超过终止密码子,包含位于NBS4基因3′端侧翼的DNA序列。
本发明包括分离的或者基本上纯化的核酸或蛋白质组合物。“分离的”或“纯化的”核酸分子或蛋白质或其生物活性部分基本上不含如自然存在环境中可见的,通常与核酸分子或蛋白质伴随或相互作用的成分。因此,一种分离的或纯化的核酸分子或蛋白质基本上不含其它细胞物质,或者当通过重组技术生产时,基本上不含培养基,或者当化学合成时,基本上不含化学前体或其它化学制剂。优选地,一种“分离的”核酸不含在作为该核酸来源的生物基因组DNA中自然位于该核酸侧翼的序列(优选地蛋白质编码序列)(即位于该核酸5’和3’端的序列)。例如,在不同实施方案中,分离的核酸分子可含有不到约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,这些序列在作为该核酸来源的细胞的基因组DNA中自然位于该核酸分子侧翼。基本上不含细胞物质的蛋白质包括含有不到约30%、20%、10%、5%或1%(干重)的污染蛋白质的蛋白质制品。当重组生产本发明的蛋白质或其生物活性部分时,培养基优选地含有不到约30%、20%、10%、5%或1%(干重)的化学前体或非目标蛋白质的化学制剂。
本发明也包括公开的核苷酸序列和它们编码的蛋白质的片段和变体。“片段”是指核苷酸序列的一部分或氨基酸序列的一部分,以及它们编码的蛋白质。核苷酸序列的片段可以编码保留天然蛋白质的生物活性的蛋白质片段,因此提供抗病性。此外,可以用作杂交探针的核苷酸序列的片段通常不编码保留对植物的生物活性的片段蛋白质。因此,一种核苷酸序列的片段可以是至少约20个核苷酸、约50个核苷酸、约100个核苷酸,和高达编码本发明的蛋白质的全长核苷酸序列。
一种Pi2-样核苷酸序列的片段编码本发明的Pi2-样多肽的生物活性部分,该片段将编码至少15、25、30、50、100、150、200、250、300、350、400、450、500、550、660、650、700、750、800、850、900、950或1000个连续氨基酸,或者可达本发明的全长Pi2-样蛋白质中所含的全部数量的氨基酸(例如,对于SEQ ID NOs:2、4、6、8、10和12分别为993、1032、660、1032、49和998个氨基酸)。可以用作杂交探针或PCR引物的Pi2-样核苷酸序列的片段通常不需要编码一种Pi2-样蛋白质的生物活性部分。
因此,一种Pi2-样核苷酸序列的片段可编码Pi2-样蛋白质的生物活性部分,或者可以是能够在下文公开的方法中作为杂交探针或PCR引物的片段。一种Pi2-样蛋白质的生物活性部分能够如下制备:分离本发明的Pi2-样核苷酸序列之一的一部分,表达该Pi2-样蛋白质的编码部分(例如通过体外重组表达),评价该Pi2-样蛋白质的编码部分的活性。作为一种Pi2-样核苷酸序列的片段的核酸分子至少含有16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1150、1200、1250、1300、1350、1400、1450、1500、1550、1660、1650、1700、1750、1800、1850、1900、1950、2000、2150、2200、2250、2300、2350、2400、2450、2500、2550、2660、2650、2700、2750、2800、2850、2900、1950、3000或3050个核苷酸,或者高达此处公开的全长Pi2-样核苷酸序列中所含核苷酸的数量(例如,对于SEQ ID NOs:1、3、5、7、9和11分别为2982、3099、4147、3099、1389和2997个核苷酸)。
“变体”是指基本上类似的序列。对于核苷酸序列,保守变体包括这样的序列:由于遗传密码的简并性,它们编码本发明的Pi2-样多肽之一的氨基酸序列。例如这些自然存在的等位基因变体能够利用众所周知的分子生物学技术鉴定,例如利用下文概述的聚合酶链反应(PCR)和杂交技术鉴定。变异核苷酸序列也包括合成产生的核苷酸序列,例如利用定点诱变产生的,但是仍然编码本发明的一种Pi2-样蛋白质的核苷酸序列。利用本文其它部分所述的序列比对程序,使用缺省参数测定,本发明的一种具体核苷酸序列的变体与这种具体核苷酸序列通常有至少约40%、50%、60%、65%、70%,通常至少约75%、80%、85%,优选地至少约90%、91%、92%、93%、94%、95%、96%、97%,更优选地至少约98%、99%或更高的序列同一性。
“变异”蛋白质是指由天然蛋白质衍生的一种蛋白质,其产生方法包括:在天然蛋白质的N端和/或C端删除(所谓的截短)或者添加一个或多个氨基酸;在天然蛋白质的一个或多个位点处删除或者添加一个或多个氨基酸;或者在天然蛋白质的一个或多个位点处置换一个或多个氨基酸。本发明包括的变异蛋白质具有生物活性,即它们仍然具有天然蛋白质的希望的生物活性,即,如此处所述的Pi2-样活性。例如,这些变体可能来源于遗传多态性或者来源于人工操作。利用本文其它部分所述的序列比对程序,使用缺省参数测定,本发明的天然Pi2-样蛋白质的生物活性变体与这种天然蛋白质的氨基酸序列有至少约40%、50%、60%、65%、70%,通常至少约75%、80%、85%,优选地至少约90%、91%、92%、93%、94%、95%、96%、97%,更优选地至少约98%、99%或者更高的序列同一性。本发明的蛋白质的一种生物活性变体与该蛋白质的不同可能在于低至1-15个氨基酸残基,低至1-10个,如6-10个,低至5个,低至4、3、2个,乃至1个氨基酸残基。
本发明的蛋白质可以用多种方法改变,包括氨基酸置换、删除、截短和插入。这些操作方法在本领域中公知。例如,Pi2-样蛋白质的氨基酸序列变体能够通过DNA突变制备。诱变和核苷酸序列改变的方法在本领域中公知。参见,例如,Kunkel(1985)Proc.Natl.Acad.Sci.USA82:488-492;Kunkel等人(1987)Methods in Enzymol.154:367-382;美国专利号4,873,192;Walker和Gaastra编著(1983)Techniques inMolecular Biology(MacMillan Publishing Company,New York)和此处引用的参考文献。关于不影响目标蛋白质生物活性的适当氨基酸置换的指南可见Dayhoff等人(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.),在此引用作为参考。保守置换,如一个氨基酸交换为具有相似性质的另一个氨基酸,可能是优选的。
因此,本发明的基因和核苷酸序列包括自然存在的序列,以及突变形式。同样,本发明的蛋白质包括自然存在的蛋白质,及其变异和修饰形式。这些变体仍然具有希望的Pi2-样活性。显然,将在编码变体的DNA中进行的突变不能将该序列置于阅读框之外,优选地不产生能够形成二级mRNA结构的互补区。参见,EP专利申请公开号75,444。
此处包括的蛋白质序列的删除、插入和置换预期不会在蛋白质特性方面产生根本的改变。然而,当难以事先预测置换、删除或插入的确切影响时,本领域技术人员应当理解,可以通过常规筛选测定评价这种影响。即,能够利用如Liu等人(2002)Mol.Genet.and Genom.267:472-480所述的测定评价这种活性,该参考文献在此引用作为参考。
变异核苷酸序列和蛋白质也包括通过诱变和重组方法,如DNA改组产生的序列和蛋白质。利用这种方法,能够操作一种或多种不同的Pi2-样编码序列,产生一种新的Pi2-样序列,该序列编码具有希望的性质的Pi2-样多肽。这样,由一群相关的序列多核苷酸产生重组多核苷酸文库,这些多核苷酸包含具有基本序列同一性并且能够在体外或体内同源重组的序列区。例如,利用这种方法,编码目标结构域的序列基序可以在本发明的Pi2-样基因与其它已知Pi2-样基因之间改组(shuffle),获得一种新基因,该基因编码目标性质改进(例如对于酶而言,Km升高)的一种蛋白质。这种DNA改组策略在本领域中公知。参见,例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri等人(1997)Nature Biotech.15:436-438;Moore等人(1997)J.Mol.Biol.272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509;Crameri等人(1998)Nature 391:288-291;和美国专利号5,605,793和5,837,458。
本发明的核苷酸序列能够用来从其它生物,特别是其它植物,包括其它单子叶植物和双子叶植物中分离相应的序列。这样,能够利用如PCR、杂交等方法,根据与此处所述序列的序列同源性鉴定这些序列。本发明包括根据与此处所述的完整Pi2-样序列或其片段的序列同一性分离的序列。这些序列包括是公开的序列的直向同源物的序列。“直向同源物”是指来源于一个共同祖先基因,并且由于物种形成而在不同物种中发现的基因。在不同物种中发现的基因,当它们的核苷酸序列和/或它们编码的蛋白质序列具有如本文其它部分定义的基本同一性时,被认为是直向同源物。直向同源物的功能在不同种之间通常高度保守。因此,本发明包括编码一种Pi2-样蛋白质并且在严格条件下与此处公开的Pi2-样核苷酸序列或其片段杂交的分离的序列。
在一种PCR方法中,能够设计寡核苷酸引物,以便在PCR反应中由从任何目标植物中提取的cDNA或基因组DNA扩增相应的DNA序列。设计PCR引物和PCR克隆的方法在本领域中公知,在Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第2版,ColdSpring Harbor Laboratory Press,Plainview,New York)中公开。参见,Innis等人编著(1990)PCR Protocols:A Guide to Methods andApplications(Academic Press,New York);Innis和Gelfand编著(1995)PCR Strategies(Academic Press,New York);Innis和Gelfand编著(1999)PCR Methods Manual(Academic Press,New York)。已知的PCR方法包括但不限于使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
在杂交技术中,利用一种已知核苷酸序列的全部或部分作为探针,用来选择性杂交来自所选生物的一群克隆基因组DNA片段或cDNA片段(即基因组或cDNA文库)中存在的其它相应核苷酸序列。这些杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,并且可以用一种可检测基团标记,如32P或其它任何可检测标记。因此,例如,通过标记基于本发明的Pi2-样序列的合成寡核苷酸,能够制备杂交探针。制备杂交探针以及构建cDNA和基因组文库的方法在本领域中公知,在Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第2版,Cold Spring Harbor Laboratory Press,Plainview,New York)中公开。
例如,此处公开的完整Pi2-样序列之一,或其一个或多个部分,可以作为一种能够特异性杂交相应Pi2-样序列和信使RNA的探针。为了在多种条件下实现特异性杂交,这些探针包含在Pi2-样序列中独特的序列,长度优选地至少约10个核苷酸,最优选地至少约20个核苷酸。可以利用这些探针通过PCR从选择的植物中扩增相应的Pi2-样序列。该技术可以用来从一种希望的植物中分离其它编码序列,或者作为一种诊断测定,测定植物中编码序列的存在。
这种诊断测定的一个例子是标记辅助筛选。在该技术中,能够使用对应于Pi2基因一部分的一种标记核苷酸序列作为杂交探针,或者作为(例如通过PCR)从植物中扩增核酸的寡核苷酸引物的基础,以根据Pi2基因的存在筛选植物。在一个实施方案中,可以利用该技术筛选含有Pi2基因序列的野生植物。在另外一个实施方案中,可以利用该技术鉴定在植物培育计划中获得的杂交产生的含Pi2植物。参见,例如,Yu等人(1991)Theor.Appl. Genet.81:471-476,和Hittalmani等人(2000)Theor.Appl.Genet.100:1121-1128。
杂交技术包括平板DNA文库的杂交筛查(噬斑或菌落;参见,例如,Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第2版,Cold Spring Harbor Laboratory Press,Plainview,New York)。这些序列的杂交可以在严格条件下进行。“严格条件”或“严格杂交条件”是指探针与其靶序列比与其它序列以更高检测程度杂交的条件(例如至少2倍于背景)。严格条件是依赖序列的,在不同环境下不同。通过控制杂交和/或洗涤条件的严格性,能够鉴定与探针100%互补的靶序列(同源探针杂交)。此外,也能够调节严格条件,容许序列中的某些错配,以便检测到较低程度的相似性(异源探针杂交)。探针的长度通常不到约1000个核苷酸,优选地不到500个核苷酸。
严格条件一般是如下条件:盐浓度不到约1.5M Na离子,一般约0.01-1.0M Na离子浓度(或其它盐),pH 7.0-8.3,对于短探针(例如10-50个核苷酸)温度至少约30℃,对于长探针(例如超过50个核苷酸)温度至少约60℃。也可以通过添加去稳定剂(如甲酰胺)达到严格条件。典型的低严格条件包括在37℃下用30-35%甲酰胺,1M NaCl,1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,在50-55℃下用1×-2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)洗涤。典型的中度严格条件包括在37℃下在40-45%甲酰胺,1.0M NaCl,1%SDS中杂交,在55-60℃下用0.5×-1×SSC洗涤。典型的高严格条件包括在37℃下在50%甲酰胺,1M NaCl,1%SDS中杂交,在60-65℃下用0.1×SSC洗涤。任选地,洗涤缓冲液中可以含有约0.1%-约1%SDS。杂交时间通常不到约24小时,通常约4小时-约12小时。
特异性一般与杂交后的洗涤有关,关键因素是最终洗涤溶液的离子强度和温度。对于DNA-DNA杂合体,可以根据Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的方程式估计Tm∶Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M是一价阳离子的摩尔浓度,%GC是DNA中鸟苷和胞嘧啶的百分比,%form是杂交溶液中甲酰胺的百分比,L是杂合体的碱基对长度。Tm是50%的互补靶序列与一种完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。每错配1%,Tm降低约1℃;因此,能够调节Tm、杂交和/或洗涤条件,以杂交具有希望的同一性的序列。例如,对于≥90%同一性的序列,Tm可能降低10℃。在确定的离子强度和pH下,通常选择严格条件比特定序列及其互补序列的热熔点(Tm)低约5℃。然而,特别严格条件能够在比热熔点(Tm)低1、2、3或4℃的温度下杂交和/或洗涤;中度严格条件能够在比热熔点(Tm)低6、7、8、9或10℃的温度下杂交和/或洗涤;低严格条件能够在比热熔点(Tm)低11、12、13、14、15或20℃的温度下杂交和/或洗涤。普通技术人员应当理解,使用该方程式、杂交和洗涤组合物和希望的Tm,自然描述了杂交和/或洗涤溶液严格性的变化。如果希望的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),优选地提高SSC浓度,以便能够采用更高的温度。关于核酸杂交的指南可见Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第一部分,第二章(Elsevier,New York);Ausubel等人编著(1995)Current Protocols in MolecularBiology,第2章(Greene Publishing and Wiley-Interscience,New York)。参见Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第2版,Cold Spring Harbor Laboratory Press,Plainview,New York)。
本发明涉及在植物中诱导对植物害虫的抗性的组合物和方法。因此,这些组合物和方法也可以用于保护植物对抗真菌病原体、病毒、线虫、昆虫等。
“抗病性”是指植物避免作为植物病原体作用结果的病害症状。即,防止病原体导致植物病害和相关的病害症状,或者另外使病原体引起的病害症状最小化或减轻。
“抗病原组合物”是指本发明的组合物具有抗病原活性,因此能够抑制、控制和/或杀死侵入的病原生物。本发明的一种抗病原组合物可使病原体攻击所致病害症状减少至少约5%-约50%,至少约10%-约60%,至少约30%-约70%,至少约40%-约80%,或者至少约50%-约90%或者更多。因此,本发明的方法能够用来保护植物对抗病害,特别是植物病原体造成的病害。
测定抗病原活性的测定在本领域中公知,定量植物在病原体感染后的抗病性的方法也公知。参见,例如,美国专利号5,614,395,在此引用作为参考。这些技术包括在一定时间内测定平均损伤直径、病原体的生物量和腐烂的植物组织的总百分比。例如,与未暴露于抗病原组合物的对照植物相比,表达一种抗病原多肽或者已经向其表面施用一种抗病原组合物的植物在病原体攻击后显示组织坏死(即损伤直径)减少或者植物死亡减少。此外,也能够根据病原体生物量的减少测定抗病原活性。例如,用一种目标病原体攻击表达一种抗病原多肽或者暴露于一种抗病原组合物的植物。在一定时间后,从接种病原体的组织上获取组织样品,提取RNA。可以根据一种特定病原体RNA转录物相对于植物特异性转录物水平的百分比确定病原体生物量的水平。参见,例如,Thomma等人(1998)Plant Biology 95:15107-15111,在此引用作为参考。
此外,体外抗病原测定包括,例如:向纸盘上添加不同浓度的抗病原组合物,将纸盘置于含有目标病原体悬液的琼脂上。在温育后,在含有有效浓度抗病原体多肽的纸盘周围显现澄清的抑菌圈(Liu等人(1994)Plant Biology 91:1888-1892,在此引用作为参考)。另外,也能够利用显微分光光度分析测定组合物的体外抗病原性质(Hu等人(1997)PlantMol.Biol.34:949-959和Cammue等人(1992)J.Biol.Chem.267:2228-2233,均在此引用作为参考)。
本发明的病原体包括但不限于病毒或类病毒、细菌、昆虫、线虫、真菌等。病毒包括任何植物病毒,例如烟草或黄瓜花叶病病毒、环斑病毒、坏死病毒、玉米矮花叶病毒等。主要作物的具体真菌和病毒病原体包括:大豆:大豆大雄疫霉(Phytophthora megasperma fsp.Glycinea)、菜豆壳球孢(Macrophomina phaseolina)、立枯丝核菌(Rhizoctoniasolani)、核盘菌(Sclerotinia sclerotiorum)、尖镰孢(Fusarium oxysporum)、菜豆间座壳(Diaporthe phaseolorum)sojae变种(大豆拟茎点霉(Phomopsis sojae))、菜豆间座壳(Diaporthe phaseolorum)caulivora变种、齐整小核菌(Sclerotium rolfsii)、菊池尾孢(Cercospora kikuchii)、大豆尾孢(Cercospora sojina)、东北霜霉(Peronospora manshurica)、束状刺盘孢(Colletotrichum dematium)(平头刺盘孢(Colletotichum truncatum))、山扁豆生棒孢(Corynespora cassiicola)、大豆壳针孢(Septoria glycines)、大豆生叶点霉(Phyllosticta sojicola)、链格孢(Alternaria alternata)、丁香假单胞菌大豆致病变种(Pseudomonas syringae p.v.glycinea)、野油菜黄单胞菌菜豆病原变种(Xanthomonas campestris p.v.phaseoli)、Microsphaera diffusa、半裸镰孢(Fusarium semitectum)、Phialophoragregata、大豆花叶病毒、大豆小丛壳(Glomerella glycines)、烟草环斑病毒、烟草线条病毒、豆薯层锈菌(Phakopsora pachyrhizi)、瓜果腐霉(Pythium aphanidermatum)、终极腐霉(Pythium ultimum)、德巴利腐霉(Pythium debaryanum)、番茄斑萎病毒、大豆异皮线虫(Heteroderaglycines)、腐皮镰孢(Fusarium solani); 芸苔:白锈菌(Albugo candida)、芸苔链格孢(Alternaria brassicae)、Leptosphaeria maculans、立枯丝核菌(Rhizoctonia solani)、核盘菌(Sclerotinia sclerotiorum)、芸苔生球腔菌(Mycosphaerella brassiccola)、终极腐霉(Pythium ultimum)、寄生霜霉(Peronospora parasitica)、粉红镰孢(Fusarium roseum)、链格孢(Alternaria alternata); 苜蓿:密执安棍状杆菌诡谲亚种(Clayibatermichiganese subsp.insidiosum)、终极腐霉(Pythium ultimum)、畸雌腐霉(Pythium irregulare)、华丽腐霉(Pythium splendens)、德巴利腐霉(Pythium debaryanum)、瓜果腐霉(Pythium aphanidermatum)、大雄疫霉(Phytophthora megasperma)、车轴草霜霉(Peronospora trifoliorum)、Phoma medicaginis var.medicaginis、苜蓿尾孢(Cercospora medicaginis)、苜蓿假盘菌(Pseudopeziza medicaginis)、Leptotrochila medicaginis、镰孢属(Fusarium)、野油菜黄单胞菌苜蓿致病变种(Xanthomonas campestrisp.v.alfalfae)、根腐丝囊霉(Aphanomyces euteiches)、Stemphyliumherbarum、苜蓿匍柄霉(Stemphylium alfalfae); 小麦:丁香假单胞菌致黑致病变种(Pseudomonas syringe p.v.atrofaciens)、冰草条黑粉菌(Urocystis agropyri)、野油菜黄单胞菌小麦致病变种(Xanthomonascampestris p.v.translucens)、丁香假单胞菌丁香致病变种(Pseudomonassyringe p.v.syringae)、链格孢(Alternaria alternata)、多主枝孢(Cladosporium herbarum)、禾本科镰孢(Fusarium graminearum)、草镰孢(Fusarium avenaceum)、大刀镰孢(Fusarium culmorum)、小麦散黑粉菌(Ustilago tritici)、小麦壳二孢(Ascochyta tritici)、Cephalosporiumgramineum、禾生刺盘孢(Collotetrichum graminicola)、小麦禾白粉菌(Erysiphe graminis f.sp.tritici)、小麦禾白粉菌(Puccinia graminis f.sp.tritici)、小麦隐匿柄锈菌(Puccinia recondita f.sp.tritici)、条形柄锈菌(Puccinia striiformis)、偃麦草核腔菌(Pyrenophora tritici-repentis)、颖枯壳针孢(septoria nodorum)、小麦壳针孢(Septoria tritici)、Septoria avenae、Pseudocercosporella herpotrichoides、立枯丝核菌(Rhizoctonia solani)、Rhizoctonia cerealis、禾顶囊壳小麦变种(Gaeumannomyces graminis var.tritici)、瓜果腐霉(Pythium aphanidermatum)、Pythium arrhenomanes、终极腐霉(Pythium ultimum)、Bipolaris sorokiniana、大麦黄矮病毒、雀麦草花叶病毒、土传小麦花叶病毒、小麦线条花叶病毒、小麦梭线条病毒、美国小麦条点病毒、麦角菌(Claviceps purpurea)、小麦腥黑粉菌(Tilletia tritici)、小麦光腥黑粉菌(Tilletia laevis)、小麦散黑粉菌(Ustilagotritici)、印度腥黑粉菌(Tilletia indica)、立枯丝核菌(Rhizoctonia solani)、Pythium arrhenomannes、禾生腐霉(Pythium gramicola)、瓜果腐霉(Pythium aphanidermatum)、高平原病毒、欧洲小麦条点病毒; 向日葵:霍尔斯单轴霉(Plasmophora halstedii)、核盘菌(Sclerotinia sclerotiorum)、翠菊黄化病毒、向日葵壳针孢(Septoria helianthi)、Phomopsis helianthi、Alternaria helianthi、百日草链格孢(Alternaria zinniae)、灰葡萄孢(Botrytis cinerea)、Phoma macdonaldii、菜豆壳球孢(Macrophominaphaseolina)、二孢白粉菌(Erysiphe cichoracearum)、米根霉(Rhizopusoryzae)、少根根霉(Rhizopus arrhizus)、匍枝根霉(Rhizopus stolonifer)、向日葵柄锈菌(Puccinia helianthi)、大丽花轮枝孢(Verticillium dahliae)、胡萝卜软腐欧文氏菌胡萝卜致病变种(Erwinia carotovorum pv.carotovora)、顶头孢(Cephalosporium acremonium)、隐地疫霉(Phytophthora cryptoges)、婆罗门参白锈(Albugo tragopogonis); 玉米:串珠镰孢(Fusarium moniliforme)subglutinans变种、斯氏欧文氏菌(Erwinia stewartii)、串珠镰孢(Fusarium moniliforme)、玉蜀黍赤霉(Gibberella zeae)(禾本科镰孢(Fusarium graminearum))、Stenocarpellamaydi(Diplodia maydis)、畸雌腐霉(Pythium irregulare)、德巴利腐霉(Pythium debaryanum)、禾生腐霉(Pythium graminicola)、华丽腐霉(Pythium splendens)、终极腐霉(Pythium ultimum)、瓜果腐霉(Pythiumaphanidermatum)、黄曲霉(Aspergillus flavus)、玉蜀黍离蠕孢(Bipolarismaydis)O,T(异旋孢腔菌(Cochliobolus heterostrophus))、炭色长蠕孢(Helminthosporium carbonum)I、II和III(Cochliobolus carbonum)、Exserohilum turcicum I、II和III、Helminthosporium pedicellatum、玉蜀黍节壶菌(Physoderma maydis)、玉蜀黍叶点霉(Phyllosticta maydis)、玉蜀黍球梗孢(Kabatiella maydis)、高粱尾孢(Cercospora sorghi)、玉蜀黍黑粉菌(Ustilago maydis)、高粱柄锈菌(Puccinia sorghi)、多堆柄锈菌(Puccinia polysora)、菜豆壳球孢(Macrophomina phaseolina)、草酸青霉(Penicillium oxalicum)、稻黑孢(Nigrospora oryzae)、多主枝孢(Cladosporium herbarum)、弯孢(Curvularia lunata)、不等弯孢(Curvularia inaequalis)、苍白弯孢(Curvularia pallescens)、密执安棍状杆菌内布拉斯加亚种(Clavibacter michiganense subsp.nebraskense)、绿色木霉(Trichoderma viride)、玉米矮花叶病毒A和B、小麦线条花叶病毒、玉米褪绿矮缩病毒、高粱麦角(Claviceps sorghi)、燕麦假单胞菌(Pseudonomas avenae)、菊欧文氏菌玉米致病变种(Erwinia chrysanthemipv.zea)、胡萝卜软腐欧文氏菌(Erwinia carotovora)、玉米矮化螺原体、大孢色二孢(Diplodia macrospora)、指疫霉(Sclerophthora macrospora)、Peronosclerospora sorghi、Peronosclerospora philippinensis、Peronosclerospora maydis、Peronosclerospora sacchari、丝轴黑粉菌(Sphacelotheca reiliana)、玉蜀黍壳锈菌(Physopella zeae)、玉蜀黍头孢(Cephalosporium maydis)、顶头孢(Cephalosporium acremonium)、玉米褪绿斑点病毒、高平原病毒、玉米花叶病毒、玉米Rayado Fino病毒、玉米线条病病毒、玉米条纹叶枯病毒、玉米粗矮缩病毒; 高梁:Exserohilum turcicum、禾生刺盘孢(Collototrichum graminicola)(禾生小丛壳(Glomerella graminicola))、高粱尾孢(Cercospora sorghi)、高粱胶尾孢(Gloeocercospora sorghi)、高粱壳二孢(Ascochyta sorghina)、丁香假单胞菌丁香致病变种(Pseudomonas syringae p.v.syringae)、野油菜黄单胞菌栖绒毛草致病变种(Xanthomonas campestris p.v.holcicola)、高粱叶斑病假单胞菌(Pseudomonas andropogonis)、紫柄锈菌(Pucciniapurpurea)、菜豆壳球孢(Macrophomina phaseolina)、Perconia circinata、串珠镰孢(Fusarium moniliforme)、链格孢(Alternaria alternata)、高粱生离蠕孢(Bipolaris sorghicola)、高粱生长蠕孢(Helminthosporiumsorghicola)、弯孢(Curvularia lunata)、Phoma insidiosa、燕麦假单胞菌(Pseudomonas avenae)(金狗尾草叶斑病假单胞菌(Pseudomonasalboprecipitans))、高粱座枝孢(Ramulispora sorghi)、高粱生座枝孢(Ramulispora sorghicola)、甜根子草黑痣菌(Phyllachara sacchari)、Sporisorium reilianum(丝轴黑粉菌(Sphacelotheca reiliana))、高粱轴黑粉菌(Sphacelotheca cruenta)、Sporisorium sorghi、甘蔗花叶病H、玉米矮花叶病毒A和B、高粱麦角(Claviceps sorghi)、立枯丝核菌(Rhizoctoniasolani)、直立顶孢霉(Acremonium strictum)、指疫霉(Sclerophthonamacrospora)、Peronosclerospora sorghi、Peronosclerosporaphilippinensis、禾生指梗霉(Sclerospora graminicola)、禾本科镰孢(Fusarium graminearum)、尖镰孢(Fusarium oxysporum)、Pythiumarrhenomanes、禾生腐霉(Pythium graminicola)等。
线虫包括寄生线虫,如根结、胞囊和损伤线虫,包括异皮线虫属(Heterodera)的种、根结线虫属(Meloidogyne)的种和球异皮线虫属(Globodera)的种;特别是胞囊线虫成员,包括但不限于:大豆异皮线虫(Heterodera glycines)(大豆胞囊线虫);甜菜异皮线虫(Heteroderaschachtii)(甜菜胞囊线虫);燕麦异皮线虫(Heterodera avenae)(谷类胞囊线虫);和马铃薯金线虫(Globodera rostochiensis)和苍白球异皮线虫(Globodera pailida)(马铃薯胞囊线虫)。损伤线虫包括短体线虫属(Pratylenchus)的种。
虫害包括选自下列目的昆虫:鞘翅目(Coleoptera)、鞘翅目(Diptera)、膜翅目(Hymenoptera)、鳞翅目(Lepidoptera)、食毛目(Mallophaga)、同翅目(Homoptera)、半翅目(Hemiptera)、直翅目(Orthoptera)、缨翅目(Thysanoptera)、革翅目(Dermaptera)、等翅目(Isoptera)、虱目(Anoplura)、蚤目(Siphonaptera)、毛翅目(Trichoptera)等,特别是鞘翅目和鳞翅目。本发明的主要作物的虫害包括: 玉米:Ostrinia nubilalis,欧洲玉米螟;Agrotis ipsilon,小地老虎;Helicoverpa zea,谷实夜蛾;Spodopterafrugiperda,草地夜蛾;Diatraea grandiosella,巨腐玉米螟;Elasmopalpuslignosellus,南美玉米苗斑螟;Diatraea saccharalis,小蔗杆划螟;Diabrotica virgifera,玉米根叶甲;Diabrotica longicornis barberi,长角叶甲;Diabrotica undecimpunctata howardi,黄瓜十一星叶甲(southerncorn rootworm);梳爪叩甲属(Melanotus)的种,狭体叩甲;Cyclocephalaborealis,圆头犀金龟(蛴螬);Cyclocephala immculata,圆头无斑犀金龟(蛴螬);Popillia japonica,日本弧丽金龟;Chaetocnema pulicaria,玉米铜色跳甲;Sphenophorus maidis,玉米长喙象;Rhopalosiphum maidis,玉米蚜;Anuraphis maidiradicis,玉米根蚜;Blissus leucopterusleucopterus,美洲谷杆长蝽;Melanoplus femurrubrum,红足黑蝗;Melanoplus sanguinipes,迁飞黑蝗;Hylemya platura,seedcorn maggot;Agromyza parvicornis,corn blot leafminer;Anaphothrips obscrurus,黄呆蓟马;Solenopsis milesta,窃叶蚁;Tetranychus urticae,二点叶螨;高粱:Chilo partellus,高粱螟;Spodoptera frugiperda,草地夜蛾;Helicoverpa zea,谷实夜蛾;Elasmopalpus lignosellus,南美玉米苗斑螟;Feltia subterranea,粒肤地老虎;Phyllophaga crinita,蛴螬;Eleodes、Conoderus和Aeolus的种,金针虫;Oulema melanopus,黑角负泥虫;Chaetocnema pulicaria,玉米铜色跳甲;Sphenophorus maidis,玉米长喙象;Rhopalosiphum maidis,玉米蚜;Sipha flava,黄伪毛蚜;Blissusleucopterus leucopterus,美洲谷杆长蝽;Contarinia sorghicola,高梁瘿蚊;Tetranychus cinnabarinus,朱砂叶螨;Tetranychus urticae,二点叶螨; 小麦:Pseudaletia unipunctata,粘虫;Spodontera fruginerda,草地夜蛾;Elasmopalpus lignosellus,南美玉米苗斑螟;Agrotis orthogonia,western cutworm;Elasmopalpus lignosellus,南美玉米苗斑螟;Oulemamelanopus,黑角负泥虫;Hypera punctata,车轴草叶象;Diabroticaundecimpunctata howardi,黄瓜十一星叶甲(southern corn rootworm);Russian wheat aphid;Schizaphis graminum,麦二叉蚜;Macrosiphumavenae,麦长管蚜;Melanoplus femurrubrum,红足黑蝗;Melanoplusdifferentialis,特异黑蝗;Melanoplus sanguinipes,迁飞黑蝗;Mayetioladestructor,小麦瘿蚊;Sitodiplosis mosellana,麦红吸浆虫;Meromyzaamericana,美洲麦杆蝇;Hylemya coarctata,wheat bulb fly;Frankliniellafusca,烟褐蓟马;Cephus cinctus,麦茎蜂;Aceria tulipae,郁金香瘿螨; 向日葵:Suleima helianthana,向日葵草芽小卷蛾(sunflower budmoth);Homoeosoma electellum,向日葵螟;zygogramma exclamationis,向日葵叶甲;Bothyrus gibbosus,胡萝卜金龟;Neolasiopteramurtfeldtiana,向日葵籽瘿蚊; 棉花:Heliothis virescens,棉花蚜(cottonbudworm);Helicoverpa zea,谷实夜蛾;Spodoptera exigua,甜菜夜蛾;Pectinophora gossypiella,棉花红铃虫;Anthonomus grandis,墨西哥棉铃象;Aphis gossypii,棉蚜;Pseudatomoscelis seriatus,棉跳盲蝽;Trialeurodes abutilonea,结翅粉虱;Lygus lineolaris,美洲牧草盲蝽;Melanoplus femurrubrum,红足黑蝗;Melanoplus differentialis,特异黑蝗;Thrips tabaci,葱蓟马;Franklinkiella fusca,烟褐蓟马;Tetranychuscinnabarinus,朱砂叶螨;Tetranychus urticae,二点叶螨; 水稻:Diatraeasaccharalis,小蔗杆划螟;Spodoptera frugiperda,草地夜蛾;Helicoverpazea,谷实夜蛾;Colaspis brunnea,葡萄肖叶甲;Lissorhoptrusoryzophilus,稻水象虫;Sitophilus oryzae,米象;Nephotettix nigropictus,黑尾叶蝉;Blissus leucopterus leucopterus,美洲谷杆长蝽;Acrosternumhilare,喜绿蝽; 大豆:Pseudoplusia includens,大豆夜蛾;Anticarsiagemmatalis,藜豆认蛾;Plathypena scabra,苜蓿绿夜蛾;Ostrinianubilalis,欧洲玉米螟;Agrotis ipsilon,小地老虎;Spodoptera exigua,甜菜夜蛾;Heliothis virescens,棉花蚜(cotton budworm);Helicoverpazea,谷实夜蛾;Epilachna varivestis,墨西哥豆瓢虫;Myzus persicae,桃蚜;Empoasca fabae,蚕豆小绿叶蝉;Acrosternum hilare,喜绿蝽;Melanoplus femurrubrum,红足黑蝗;Melanoplus differentialis,特异黑蝗;Hylemya platura,seedcorn maggot;Sericothrips variabilis,大豆蓟马(soybean thrips);Thrips tabaci,葱蓟马;Tetranychus turkestani,土耳其斯坦叶螨;Tetranychus urticae,二点叶螨; 大麦:Ostrinianubilalis,欧洲玉米螟;Agrotis ipsilon,小地老虎;Schizaphis graminum,麦二叉蚜;Blissus leucopterus leucopterus,美洲谷杆长蝽;Acrosternumhilare,喜绿蝽;Euschistus servus,褐臭蝽;Delia platura,灰地种蝇;Mayetiola destructor,小麦瘿蚊;Petrobia latens,麦岩螨; 油籽油菜:Brevicoryne brassicae,甘蓝蚜;Phyllotreta cruciferae,萝卜菜跳甲;Mamestra configurata,披肩粘虫;Plutella xylostella,菜蛾;种蝇属(Delia)的种,甘蓝种蝇蛆(Root maggots)。
下列术语用来描述两种或多种核酸或多核苷酸之间的序列关系:(a)“参照序列”,(b)“比较窗口”,(c)“序列同一性”,(d)“百分序列同一性”,和(e)“基本同一性”。
(a)如此处所用的“参照序列”是用作序列比较基础的一种确定的序列。参照序列可以是一种特定序列的整体或部分;例如,全长cDNA或基因序列的片段,或完整的cDNA或基因序列。
(b)如此处所用的“比较窗口”是指一种多核苷酸序列的连续、指定的片段,其中与用于两种序列的最佳比对的参照序列(不含添加或缺失)相比,比较窗口中的多核苷酸序列可能包含添加或缺失(即空位)。比较窗口的长度通常为至少20个连续核苷酸,任选地可以是30、40、50、100个或更长。本领域技术人员应当理解,由于多核苷酸序列中含有空位,为了避免与参照序列的高相似性,一般引入空位罚分,从匹配数中减去。
用于比较的序列比对方法在本领域中公知。因此,任意两种序列之间的百分序列同一性的测定能够用一种数学算法进行。这些数学算法的非限制性例子有Myers和Miller(1988)CABIOS 4:11-17的算法;Smith等人.(1981)Adv.Appl.Math.2:482的局部同源性算法;Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法;Pearson和Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的相似性搜索法;Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 872264的算法,如Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877所述改良。
这些数学算法的计算机实现能够用于序列比较,来确定序列同一性。这些实现方法包括,但不限于:PC/Gene程序中的CLUSTAL(可获自Intelligenetics,Mountain View,California);ALIGN程序(2.0版)和Wisconsin Genetics Software Package,Version 8中的GAP、BESTFIT、BLAST、FASTA和TFASTA(可获自Genetics ComputerGroup(GCG),575 Science Drive,Madison,Wisconsin,USA)。利用这些程序的比对能够用缺省参数进行。CLUSTAL程序在下列参考文献中较好地描述:Higgins等人(1988)Gene 73:237-244(1988);Higgins等人(1989)CABIOS 5:151-153;Corpet等人(1988)Nucleic Acids Res.16:10881-90;Huang等人(1992)CABIOS 8:155-65;和Pearson等人(1994)Meth.Mol.Biol.24:307-331。ALIGN程序是以上文Myers和Miller(1988)的算法为基础。当比较氨基酸序列时,ALIGN程序能够采用PAM120权重残基表、12的空位长度罚分、4的空位罚分。Altschul等人(1990)J.Mol.Biol.215:403的BLAST程序以上文Karlin和Altschul(1990)的算法为基础。BLAST核苷酸搜索能够用BLASTN程序进行,得分=100,字长=12,获得与编码本发明的一种蛋白质的核苷酸序列同源的核苷酸序列。BLAST蛋白质搜索能够用BLASTX程序进行,得分=50,字长=3,获得与本发明的一种蛋白质或多肽同源的氨基酸序列。为了获得带有空位的比对进行比较,能够采用Gapped BLAST(在BLAST 2.0中),如Altschul等人(1997)Nucleic Acids Res.25:3389所述。此外,也能够利用PSI-BLAST(在BLAST 2.0中)进行迭代(iterated)搜索,检测分子间的距离关系。参见Altschul等人(1997),同上文。当采用BLAST、Gapped BLAST、PSI-BLAST时,各自程序能够使用缺省参数(例如核苷酸序列使用BLASTN,蛋白质使用BLASTX)。参见http://www.ncbi.nlm.nih.gov。比对也可以通过检查手工进行。
除非另外说明,此处提到的序列同一性/相似性值是指使用GAP版本10使用下列参数获得的值:%同一性使用50的空位权重和3的长度权重;%相似性使用12的空位权重和4的长度权重,或者使用任何相当的程序。“相当的程序”是指任何序列比较程序,其用于任意两种所述序列,与GAP版本10产生的相应比对相比,产生具有相同核苷酸或氨基酸残基匹配和相同百分序列同一性的比对。
GAP使用Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的算法来发现两种完整序列的比对,最大化匹配数,最小化空位数。GAP考虑所有可能的比对和空位位置,产生具有最大匹配碱基数量和最小空位的比对。它可能以匹配碱基单位提供空位产生罚分和空位延伸罚分。GAP必须在与插入的每个空位匹配的空位产生罚分上收益(profit)。如果选择空位延伸罚分大于零,GAP还必须对插入的每个空位在空位长度和空位延伸罚分上收益。在分析蛋白质序列的Wisconsin GeneticsSoftware Package版本10中,缺省空位产生罚分和空位延伸罚分值分别为8和2。对于核苷酸序列,缺省空位产生罚分为50,而缺省空位延伸罚分是3。空位产生和空位延伸罚分能够表达为选自0-200的整数。因此,例如,空位产生和空位延伸罚分可以是0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更高。
GAP是最佳比对家族中的一员。该家族可能有许多成员,但是没有其它成员有更好的质量。GAP显示4个比对优值:质量、比例、同一性和相似性。为了比对序列,质量是是最大化的度量。比例是质量除以较短片段中的碱基数。百分同一性是实际匹配的标志的百分比。百分相似性是类似的标志的百分比。忽略空位对面的标志。当一对标志的打分矩阵值大于或等于相似性阈值0.50时,对相似性打分。WisconsinGenetics Software Package版本10使用的打分矩阵是BLOSUM62(参见,Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。
(c)对于两种核酸或多肽序列,如此处所用的“序列同一性”或“同一性”是指,当在指定比较窗口中比对最大对应时,两种序列中相同的残基。当百分序列同一性用于蛋白质时,可以认为不同的残基位点通常因保守氨基酸置换而不同,其中氨基酸残基置换具有相似化学性质(例如电荷或疏水性)的其它氨基酸残基,因此不改变分子的功能性质。当序列因保守置换而不同时,可以向上调节百分序列同一性,校正该置换的保守性质。因保守置换而不同的序列被称为具有“序列相似性”或“相似性”。本领域技术人员公知进行这种调节的方法。一般包括作为部分而不是完全错配对保守置换打分,从而提高百分序列同一性。因此,例如,当一个相同的氨基酸得出1的得分,而一个非保守置换得出0的得分时,保守置换的得分为0-1。计算保守置换的得分,例如用程序PC/GENE(Intelligenetics,Mountain View,California)进行。
(d)如此处所用的“百分序列同一性”是指通过在比较窗口内比较两种最佳比对的序列测得的值,其中与用于两种序列最佳比对的参照序列(不含添加或缺失)相比,比较窗口中多核苷酸序列的一部分可能含有添加或缺失(即空位)。百分比如下计算:测定两条序列中出现相同核酸碱基或氨基酸残基的位点数,得到匹配位点数,匹配位点数除以比较窗口中的位点总数,结果乘以100,得到百分序列同一性。
(e)(i)术语多核苷酸序列的“基本同一性”是指,使用描述的比对程序之一,使用标准参数,一种多核苷酸包含与参照序列有至少70%、优选地至少80%、更优选地至少90%、最优选地至少95%序列同一性的序列。本领域技术人员应当知道,考虑密码子简并性、氨基酸相似性、阅读框位置等,能够适当地调节这些值,以测定两种核苷酸序列编码的蛋白质的相应的同一性。用于这些目的的氨基酸序列的基本同一性通常是指至少60%、更优选地至少70%、80%、90%和最优选地至少95%的序列同一性。
核苷酸序列基本相同的另外一个指征是,两种分子在严格条件下是否彼此杂交。通常选择严格条件为,在确定的离子强度和pH下,温度比指定序列的热熔点(Tm)低约5℃。然而,严格条件包括比Tm低约1℃-约20℃的温度,这取决于如本文其它部分确定的希望的严格性程度。如果在严格条件下彼此不杂交的核酸编码的多肽基本上相同,则这些核酸基本上相同。例如,当使用遗传编码允许的最大密码子简并性产生一个拷贝的核酸时,这可能发生。两种核酸序列基本相同的一个指征是,第一种核酸编码的多肽与第二种核酸编码的多肽具有免疫交叉反应性。
(e)(ii)术语“基本同一性”对于多肽而言是指一种肽含有一种序列,在指定的比较窗口上,该序列与一种参照序列有至少70%、优选地80%、更优选地85%、最优选地至少90%或95%的序列同一性。优选地,使用Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法进行最佳比对。两种肽序列基本上相同的一个指征是一种肽与针对第二种肽的抗体具有免疫反应性。因此,例如,当一种肽与第二种肽只因为一个保守置换而不同时,这两种肽基本上相同。除了不同的残基位置可能因保守氨基酸改变而不同之外,“基本上相似的”肽共有如上所述的序列。
本发明的Pi2-样序列在用于在目标植物中表达的表达盒中提供。该盒包含与本发明的一种Pi2-样序列有效连接的5′和3′调节序列。“有效连接”是指一个启动子与第二个序列之间的功能连接,其中该启动子序列启动并介导对应于第二种序列的DNA序列的转录。有效连接通常是指连接的核酸序列是连续的,在需要连接两个蛋白质编码区时,是连续的并且在同一个阅读框内。该盒还可含有共转化生物的至少另外一个基因。此外,该基因也能够在多表达盒中提供。
这种表达盒含有多个限制性酶切位点,用于插入Pi2-样序列,使之位于调节区的转录调节下。该表达盒还可含有选择性标记基因。
该表达盒以5′-3′转录方向包含一个转录和翻译起始区(即启动子)、本发明的Pi2-样DNA序列和一个在植物中起作用的转录和翻译终止区(即终止区)。对于植物宿主和/或本发明的Pi2-样DNA序列,该启动子可以是天然或类似的,或者是外源或异源的。此外,该启动子也可以是天然序列或者是一种合成序列。当启动子对于植物宿主是“外源”或“异源的”时,是指该启动子在引入该启动子的天然植物中未发现。当启动子对于本发明的Pi2-样DNA序列是“外源”或“异源的”时,是指该启动子不是用于有效连接的本发明的Pi2-样DNA序列的天然或自然存在的启动子。如此处所用的,一种嵌合基因包含一个编码序列,该序列与一个对于编码序列异源的转录起始区有效连接。
使用异源启动子表达序列可能是优选的,可以使用天然启动子序列。这些构建体将改变本发明的Pi2-样蛋白质在植物或植物细胞中的表达水平。于是,植物或植物细胞的表型改变。
终止区可以与转录起始区同源,可以与有效连接的目标Pi2-样DNA序列同源,可以与植物宿主同源,或者可以来自另外一个来源(即对于该启动子、目标Pi2-样DNA序列、植物宿主或其任意组合而言,是外源或异源的)。适当的终止区可以从根癌土壤杆菌的Ti质粒获得,如章鱼氨酸合酶和胭脂氨酸合酶终止区。参见Guerineau等人(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev.5:141-149;Mogen等人(1990)Plant Cell2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)Nucleic Acids Res.17:7891-7903;和Joshi等人(1987)Nucleic Acid Res.15:9627-9639。
适当时,为了提高在转化植物中的表达可以优化基因。即,为了提高表达,能够利用植物优选的密码子合成这些基因。关于宿主优选的密码子选择的讨论,参见,例如,Campbell和Gowri(1990)Plant Physiol.92:1-11。合成植物优选的基因的方法在本领域中可以获得。参见,例如,美国专利号5,380,831和5,436,391,和Murray等人(1989)Nucleic AcidsRes.17:477-498,在此引用作为参考。
已知另外一些序列修饰可提高细胞宿主中的基因表达。包括除去编码假聚腺苷酸化信号、外显子-内含子剪接位点信号、转座子样重复片段的序列,和可能不利于基因表达的其它一些良好表征的序列。可以调节序列的G-C含量至指定细胞宿主的平均水平,参照在该宿主细胞中表达的已知基因计算。可能时修饰该序列,以避免预测的发夹二级mRNA结构。
表达盒还可能在表达盒构建体中含有5′前导序列。这些前导序列能够用来提高翻译。翻译前导序列在本领域中公知,包括:微小RNA病毒前导序列,例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等人(1989)Proc.Natl.Acad.Sci.USA 86:6126-6130);马铃薯Y病毒前导序列,例如TEV前导序列(烟草蚀纹病毒)(Gallie等人(1995)Gene165(2):233-238)、MDMV前导序列(玉米矮花叶病毒)(Virology 154:9-20)和人免疫球蛋白重链结合蛋白(BiP)(Macejak等人(1991)Nature353:90-94);来自苜蓿花叶病毒外壳蛋白mRNA的非翻译前导序列(AMV RNA 4)(Jobling等人(1987)Nature 325:622-625);烟草花叶病毒前导序列(TMV)(Gallie等人(1989)Molecular Biology of RNA,Cech编著(Liss,New York),237-256);和玉米褪绿斑点病毒前导序列(MCMV)(Lommel等人(1991)Virology 81:382-385)。参见,Della-Cioppa等人(1987)Plant Physiol.84:965-968。也能够使用已知可增强翻译的其它方法,例如内含子等。
在制备表达盒时,可以操作不同的DNA片段,以提供适当方向的并且(适当时)处于正确阅读框中的DNA序列。为此,可以使用连接体或接头连接DNA片段,或者可以利用其它操作提供适当的限制性酶切位点、除去多余的DNA、除去限制性酶切位点等。为此,可以采用体外诱变、引物修复、限制性酶切、退火、再置换,例如转换和颠换。
表达盒通常含有一种选择性标记基因,用于筛选转化的细胞。选择性标记基因用于筛选转化的细胞或组织。标记基因包括编码抗生素抗性的基因,如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及提供除草剂化合物抗性的基因,如glufosinate铵、溴草腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)。通常参见Yarranton(1992)Curr.Opin.Biotech.3:506-511;Christopherson等人(1992)Proc.Natl.Acad.Sci.USA 89:6314-6318;Yao等人(1992)Cell 71:63-72;Reznikoff(1992)Mol.Microbiol.6:2419-2422;Barkley等人(1980)in The Operon,pp.177-220;Hu等人(1987)Cell 48:555-566;Brown等人(1987)Cell49:603-612;Figge等人(1988)Cell 52:713-722;Deuschle等人(1989)Proc.Natl.Acad.Aci.USA 86:5400-5404;Fuerst等人(1989)Proc.Natl.Acad.Sci.USA 86:2549-2553;Deuschle等人(1990)Science 248:480-483;Gossen(1993)博士论文,University of Heidelberg;Reines等人(1993)Proc.Natl.Acad.Sci.USA 90:1917-1921;Labow等人(1990)Mol.Cell.Biol.10:3343-3356;Zambretti等人(1992)Proc.Natl.Acad.Sci.USA89:3952-3956;Baim等人(1991)Proc.Natl.Acad.Sci.USA88:5072-5076;Wyborski等人(1991)Nucleic Acids Res.19:4647-4653;Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10:143-162;Degenkolb等人(1991)Antimicrob.Agents Chemother.35:1591-1595;Kleinschnidt等人.(1988)Biochemistry 27:1094-1104;Bonin(1993)博士论文,University of Heidelberg;Gossen等人(1992)Proc.Natl.Acad.Sci.USA 89:5547-5551;Oliva等人(1992)Antimicrob.Agents Chemother.36:913-919;Hlavka等人(1985)Handbook of ExperimentalPharmacology,Vol.78(Springer-Verlag,Berlin);Gill等人(1988)Nature334:721-724。这些公开内容在此引用作为参考。
以上的选择性标记基因列表不是限制性的。本发明能够使用任何选择性标记基因。
在本发明的实施过程中能够使用多种启动子。可以根据希望的结果选择启动子。
本发明的核酸能够与用于在植物中表达的组成型、组织优选的或其它一些启动子组合。组成型启动子包括,例如:WO 99/43838和美国专利号6,072,050公开的Rsyn7启动子的核心启动子和其它一些组成型启动子;核心CaMV 35S启动子(Odell等人(1985)Nature 313:810-812);水稻肌动蛋白(McElroy等人(1990)Plant Cell 2:163-171);遍在蛋白(Christensen等人(1989)Plant Mol.Biol.12:619-632和Christensen等人(1992)Plant Mol.Biol.18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.81:581-588);MAS(Velten等人(1984)EMBO J.3:2723-2730);ALS启动子(美国专利号5,659,026)等。其它组成型启动子包括,例如,美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142和6,177,611。
从一种诱导型启动子,特别是从一种病原体诱导型启动子表达基因通常是有利的。这些启动子包括来自发病机理相关蛋白质(PR蛋白)的启动子,它们在感染一种病原体后被诱导;例如PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、壳多糖酶等。参见,例如,Redolfi等人(1983)Neth.J.PlantPathol.89:245-254;Uknes等人(1992)Plant Cell 4:645-656;和Van Loon(1985)Plant Mol.Virol.4:111-116。参见WO 99/43819,在此引用作为参考。
有意义的是在病原体感染部位处或附近局部表达的启动子。参见,例如,Marineau等人(1987)Plant Mol.Biol.9:335-342;Matton等人(1989)Molecular Plant-Microbe Interactions 2:325-331;Somsisch等人(1986)Proc.Natl.Acad.Sci.USA 83:2427-2430;Somsisch等人(1988)Mol.Gen.Genet.2:93-98;和Yang(1996)Proc.Natl.Acad.Sci.USA93:14972-14977。参见Chen等人(1996)Plant J.10:955-966;Zhang等人(1994)Proc.Natl.Acad.Sci.USA 91:2507-2511;Warner等人(1993)Plant J.3:191-201;Siebertz等人(1989)Plant Cell 1:961-968;美国专利号5,750,386(线虫诱导型);和此处引用的参考文献。特别有意义的是玉米PRms基因的诱导型启动子,该基因的表达被病原体串珠镰孢诱导(参见,例如,Cordero等人(1992)Physiol.Mol.Plant Path.41:189-200)。
另外,由于发现病原体是通过创伤或昆虫损伤进入植物,在本发明的进行中可以使用创伤诱导型启动子。这些创伤诱导型启动子包括:马铃薯蛋白酶抑制因子(pin II)基因(Ryan(1990)Ann.Rev.Phytopath.28:425-449;Duan等人(1996)Nature Biotechnology 14:494-498);wun1和wun2,美国专利号5,428,148;win1和win2(Stanford等人(1989)Mol.Gen.Genet.215:200-208);系统素(McGurl等人(1992)Science225:1570-1573);WIP1(Rohmeier等人(1993)Plant Mol.Biol.22:783-792;Eckelkamp等人(1993)FEBS Letters 323:73-76);MPI基因(Corderok等人(1994)Plant J.6(2):141-150);等等,在此引用作为参考。
使用化学调节的启动子,能够通过施用一种外源化学调节剂调节一种基因在植物中的表达。根据目的不同,启动子可以是化学制品诱导型启动子,施用化学制品诱导基因表达,或者是化学制品抑制型启动子,施用化学制品抑制基因表达。化学制品诱导型启动子在本领域公知,包括但不限于:玉米In2-2启动子,它被苯磺酰胺除草剂安全剂激活,玉米GST启动子,它被用作芽前除草剂的疏水性亲电子化合物激活,和烟草PR-1a启动子,它被水杨酸激活。其它重要的化学制品调节启动子包括类固醇反应性启动子(参见,例如,糖皮质激素诱导型启动子,Schena等人(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425和McNellis等人(1998)Plant J.14(2):247-257)和四环素诱导型和四环素抑制型启动子(参见,例如,Gatz等人(1991)Mol.Gen.Genet.227:229-237,和美国专利号5,814,618和5,789,156),在此引用作为参考。
组织优选的启动子能够用来提高Pi2-样蛋白质在一种具体植物组织内的表达。组织优选的启动子包括:Yamamoto等人(1997)Plant J.12(2):255-265;Kawamata等人(1997)Plant Cell Physiol.38(7):792-803;Hansen等人(1997)Mol.Gen Genet.254(3):337-343;Russell等人(1997)Transgenic Res.6(2):157-168;Rinehart等人(1996)Plant Physiol.112(3):1331-1341;Van Camp等人(1996)Plant Physiol.112(2):525-535;Canevascini等人(1996)Plant Physiol.112(2):513-524;Yamamoto等人(1994)Plant Cell Physiol.35(5):773-778;Lam(1994)Results Probl.CellDiffer.20:181-196;Orozco等人(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka等人(1993)Proc Natl.Acad.Sci.USA 90(20):9586-9590;和Guevara-Garcia等人(1993)Plant J.4(3):495-505所述。必要时,为了弱表达可以修饰这些启动子。
叶特异的启动子在本领域中公知。参见,例如:Yamamoto等人(1997)Plant J.12(2):255-265;Kwon等人(1994)Plant Physiol.105:357-67;Yamamoto等人(1994)Plant Cell Physiol.35(5):773-778;Gotor等人(1993)Plant J.3:509-18;Orozco等人(1993)Plant Mol.Biol.23(6):1129-1138;和Matsuoka等人(1993)Proc.Natl.Acad.Sci.USA90(20):9586-9590。
根优选的启动子公知,能够选自可从文献中获得的许多启动子,或者从不同相容物种中从头分离。参见,例如,Hire等人(1992)PlantMol.Biol.20(2):207-218(大豆根特异的谷氨酰胺合成酶基因);Keller和Baumgartner(1991)Plant Cell 3(10):1051-1061(法国菜豆(French bean)GRP 1.8基因中根特异的控制元件);Sanger等人(1990)Plant Mol.Biol.14(3):433-443(根癌土壤杆菌(Agrobacterium tumefaciens)的甘露碱合酶(MAS)基因的根特异的启动子);和Miao等人(1991)Plant Cell3(1):11-22(编码细胞溶质谷氨酰胺合成酶(GS)的全长cDNA克隆,它在大豆的根和根瘤中表达)。参见,Bogusz等人(1990)Plant Cell2(7):633-641,其中描述了从固氮非豆科植物Parasponia andersonii和相关非固氮非豆科植物Trema tomentosa的血红蛋白基因中分离的两种根特异的启动子。这些基因的启动子与一个β-葡糖醛酸糖苷酶报道基因连接,引入非豆科植物烟草(Nicotiana tabacum)和豆科植物百脉根(Lotuscorniculatus)中,在这两种情况下,根特异启动子的活性得以保持。Leach和Aoyagi(1991)描述了他们对毛根土壤杆菌(Agrobacterium rhizogenes)的高表达rolC和rolD根诱导基因的启动子的分析(参见,Plant Science(Limerick)79(1):69-76)。他们的结论是,增强子和组织优选的DNA决定簇在那些启动子中分离。Teeri等人(1989)采用与lacZ基因融合,显示编码章鱼氨酸合酶的土壤杆菌T-DNA基因在根尖表皮中特别有活性,并且TR2′基因在完整植物中是根特异的,被叶组织的创伤所刺激,这是杀昆虫或杀幼虫基因的特别希望的特征组合(参见EMBO J.8(2):343-350)。与nptII(新霉素磷酸转移酶II)融合的TR1′基因显示类似的特征。其它根优选的启动子包括:VfENOD-GRP3基因启动子(Kuster等人(1995)Plant Mol.Biol.29(4):759-772);和rolB启动子(Capana等人(1994)Plant Mol.Biol.25(4):681-691。参见美国专利号5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732;和5,023,179。
“种子优选的”启动子包括“种子特异的”启动子(在种子发育过程中有活性的启动子,如种子贮存蛋白的启动子)以及“种子萌芽”启动子(在种子萌芽过程中有活性的启动子)。参见,Thompson等人(1989)BioEssays 10:108,在此引用作为参考。这些种子优选的启动子包括但不限于:Ciml(细胞分裂素诱导的信息);cZ19Bl(玉米19kDa玉米醇溶蛋白);milps(肌-肌醇-1-磷酸合酶);和celA(纤维素合酶)(参见WO00/11177,在此引用作为参考)。γ-玉米醇溶蛋白是一种优选的胚芽乳特异的启动子。Glob-1是一种优选的胚芽特异的启动子。对于双子叶植物,种子特异的启动子包括,但不限于:菜豆β-菜豆蛋白、napin、β-conglycinin、大豆凝集素、cruciferin等。对于单子叶植物,种子特异的启动子包括,但不限于:玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、waxy、shrunken 1、shrunken 2、球蛋白1等。参见WO 00/12733,其中公开了来自end1和end2基因的种子优选的启动子;在此引用作为参考。
当希望低水平表达时,可使用弱启动子。“弱启动子”通常是指引导一种编码序列低水平表达的启动子。低水平是指约1/1000转录物到约1/100,000转录物到约1/500,000转录物的水平。此外,也应当知道,弱启动子也包括只在少数细胞中表达而在其它细胞中不表达,从而具有低水平总表达的启动子。当一种启动子以不可接受的高水平表达时,该启动子序列的部分可以被删除或者被修饰,以降低表达水平。
这类弱组成型启动子包括,例如:Rsyn7启动子的核心启动子(WO99/43838和美国专利号6,072,050)、核心35S CaMV启动子等。其它组成型启动子包括,例如:美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;和5,608,142。参见美国专利号6,177,611,在此引用作为参考。
本发明的方法包括将一种核苷酸构建体引入一个植物中。“引入”是指以一种方式将核苷酸构建体给予植物,使得该构建体能够到达植物细胞的内部。本发明的方法不取决于向植物中引入核苷酸构建体的一种具体方法,只要该核苷酸构建体能够到达该植物至少一种细胞的内部。将核苷酸构建体引入植物内的方法在本领域中公知,包括但不限于:稳定转化方法、瞬时转化方法和病毒介导的方法。
转化方案以及将核苷酸序列引入植物内的方案可能因将要转化的植物或植物细胞的类型(即单子叶植物还是双子叶植物)而异。将核苷酸序列引入植物细胞内,随后插入植物基因组内的适当方法包括:显微注射(Crossway等人(1986)Biotechniques 4:320-334)、电穿孔(Riggs等人(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606)、土壤杆菌介导的转化(Townsend等人,美国专利号5,563,055;Zhao等人,美国专利号5,981,840)、直接基因转移(Paszkowski等人(1984)EMBO J.3:2717-2722和冲击(ballistic)粒子加速(参见,例如,Sanford等人,美国专利号4,945,050;Tomes等人,美国专利号5,879,918;Tomes等人,美国专利号5,886,244;Bidney等人,美国专利号5,932,782;Tomes等人(1995)″通过微注射颗粒轰击的DNA直接转移入完整植物细胞,″in Plant Cell,Tissue,and Organ Culture:Fundamental Methods,Gamborg和Phillips编著(Springer-Verlag,Berlin);MeCabe等人.(1988)Biotechnology6:923-926);和Lecl转化(WO 00/28058)。参见Weissinger等人(1988)Ann.Rev.Genet.22:421-477;Sanford等人(1987)Particulate Science andTechnology 5:27-37(洋葱);Christou等人(1988)Plant Physiol.87:671-674(大豆);McCabe等人(1988)Bio/Technology 6:923-926(大豆);Finer和McMullen(1991)In Vitro Cell Dev.Biol.27P:175-182(大豆);Singh等人(1998)Theor.Appl.Genet.96:319-324(大豆);Datta等人(1990)Biotechnology 8:736-740(水稻);Klein等人(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309(玉米);Klein等人(1988)Biotechnology6:559-563(玉米);Tomes,美国专利号5,240,855;Buising等人,美国专利号5,322,783和5,324,646;Tomes等人(1995)′通过微注射颗粒轰击的DNA直接转移入完整植物细胞,″,Plant Cell,Tissue,and OrganCulture:Fundamental Methods,Gamborg编著(Springer-Verlag,Berlin)(玉米);Klein等人(1988)Plant Physiol.91:440-444(玉米);Fromm等人(1990)Biotechnology 8:833-839(玉米);Hooykaas-Van Slogteren等人(1984)Nature(London)311:763-764;Bowen等人,美国专利号5,736,369(谷类);Bytebier等人(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(百合);De Wet等人(1985)The Experimental Manipulation of Ovule Tissues,Chapman等人编著(Longman,New York),197-209(花粉);Kaeppler等人(1990)Plant Cell Reports 9:415-418和Kaeppler等人(1992)Theor.Appl.Genet.84:560-566(须(whisker)-介导的转化);D′Halluin等人(1992)Plant Cell 4:1495-1505(电穿孔);Li等人(1993)Plant Cell Reports12:250-255以及Christou和Ford(1995)Annals of Botany 75:407-413(水稻);Osjoda等人(1996)Nature Biotechnology 14:745-750(玉米,通过根癌土壤杆菌);均在此引用作为参考。
“稳定转化”是指引入植物内的核苷酸构建体整合到植物基因组内,并且能够被其后代遗传。“瞬时转化”是指引入植物的核苷酸构建体不能整合到植物基因组内。
可以通过使植物接触一种病毒或病毒核酸,将本发明的核苷酸构建体导入植物内。这些方法通常包括将本发明的核苷酸构建体掺入病毒DNA或RNA分子内。应当知道,本发明的Pi2-样蛋白最初可以被合成为病毒多蛋白的一部分,然后可以通过在体内或体外蛋白水解加工,产生希望的重组蛋白。此外,也应当知道,本发明的启动子也包括用于被病毒RNA聚合酶转录的启动子。涉及病毒DNA或RNA分子,将核苷酸构建体引入植物内并且在其中表达编码蛋白质的方法,在本领域中公知。参见,例如,美国专利号5,889,191、5,889,190、5,866,785、5,589,367和5,316,931;在此引用作为参考。
已经转化的细胞可以按照常规方法生长为植物。参见,例如,McCormick等人(1986)Plant Cell Reports 5:81-84。这些植物然后可以生长,用同样转化的株或不同的株授粉,产生的杂种组成型表达希望的确定的表型特征。可以生长两代或两代以上,以确保希望的表型特征的表达稳定保持并且遗传,然后收获种子,以确保希望的表型特征得到表达。这样,本发明提供转化的种子(也被称为“转基因种子”),其含有稳定掺入基因组内的本发明的核苷酸构建体,例如本发明的一种表达盒。
本发明可以用来转化任何植物种,包括,但不限于单子叶植物和双子叶植物。目标植物种的例子包括但不限于:玉米(玉蜀黍(Zea mays)),芸苔属(Brassica)的种(例如芸苔(B.napus)、芜菁(B.rapa)、雪里蕻(B.juncea)),特别是可以用作种子油来源的芸苔属的种,苜蓿(Medicagosativa),水稻(Oryza sativa),黑麦(Secale cereale),高粱(Sorghum bicolor、Sorghum vulgare),黍(例如御谷(Pennisetum glaucum)、稷(Panicummiliaceum)、谷子(Setaria italica)、finger millet(Eleusine coracana)),向日葵(Helianthus annuus),红花(Carthamus tinctorius),小麦(Triticumaestivum),大豆(Glycine max),烟草(Nicotiana tabacum),马铃薯(Solanum tuberosum),花生(Arachis hypogaea),棉花(海岛棉(Gossypiumbarbadense)、陆地棉(Gossypium hirsutum)),甘薯(Ipomoea batatus),木薯(Manihot esculenta),咖啡(咖啡属(Coffea)的种),椰子(Cocosnucifera),菠萝(Ananas comosus),柑桔(柑桔属(Citrus)的种),可可(Theobroma cacao),茶树(Camellia sinensis),香蕉(芭蕉属(Musa)的种),鳄梨(Persea americana),无花果(Ficus casica),番石榴(Psidiumguajava),芒果(Mangifera indica),橄榄(Olea europaea),番木瓜(Caricapapaya),腰果树(Anacardium occidentale),澳洲坚果(Macadamiaintegrifolia),扁桃(Prunus amygdalus),甜菜(Beta vulgaris),甘蔗(甘蔗属(Saccharum)的种),燕麦,大麦,蔬菜,观赏植物和松柏植物。
蔬菜包括:番茄(Lycopersicon esculentum),莴苣(例如Lactucasativa),菜豆(Phaseolus vulgaris),利马豆(Phaseolus limensis),豌豆(山黧豆属(Lathyrus)的种),和香瓜属(Cucumis)的成员,如黄瓜(C.sativus)、罗马甜瓜(C.cantalupensis)和甜瓜(C.melo)。观赏植物包括印度杜鹃花(杜鹃花属(Rhododendron)的种)、八仙花(Macrophylla hydrangea)、木槿(朱槿(Hibiscus rosasanensis))、玫瑰(蔷薇属(Rosa)的种)、郁金香(郁金香属(Tulipa)的种)、水仙花(水仙属(Narcissus)的种)、矮牵牛(Petuniahybrida)、康乃馨(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊花。
在实施本发明中可以使用的松柏植物包括,例如:松树,如火炬松(Pinus taeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、扭叶松(Pinus contorta)和辐射松(Pinus radiata);花旗松(Pseudotsugamenziesii);加拿大铁杉(Tsuga canadensis);白云杉(Picea glauca);红杉(北美红杉(Sequoia sempervirens));true firs,如银枞(温哥华冷杉(Abiesamabilis))和香脂冷杉(Abies balsamea);和雪松,如北美香柏(Thujaplicata)和黄扁柏(Chamaecyparis nootkatensis)。优选地,本发明的植物是作物(例如,玉米、苜蓿、向日葵、芸苔、大豆、棉花、红花、花生、高粱、小麦、黍、烟草等),更优选地是玉米和大豆植物,更优选地是玉米植物。
转化对引入的本发明的Pi2-样基因表达的影响可以用多种方法测定。例如,未转化状态与植物已经含有一种Pi2-样基因的转化状态之间特定基因表达的差异可以用基因表达谱测定。总RNA或mRNA能够利用基因表达谱法(GeneCalling)分析,如美国专利号5,871,697所述,在此引用作为参考。
下列实施例用来说明而不是限制。
                          实验
概述
最近成功分离了两种抗性基因,Pib和Pi-ta。Pib从两个印度尼西亚栽培种和两个马来西亚栽培种独立地渐渗到不同的日本水稻(Ovizasativa spp.Japonica)栽培种中(Yokoo等人(1978)Jpn.J.Breed.28:359-385)。推断的Pib基因的氨基酸序列含有一个核苷酸结合位点(NBS)和富含亮氨酸的重复片段(LRRs)(Wang等人(1999)Plant J.19:55-64),具有许多克隆的植物抗性基因的共同特征(Bent(1996)PlantCell 8:1757-1771)。有趣的是,Pi-ta类似于Pib,因为它含有一个位于中心的核苷酸结合位点和位于C端的富含亮氨酸的结构域(LRD)。AVR-Pi-ta(176)蛋白缺乏分泌和前蛋白质序列,在酵母双杂交系统和体外结合测定中都能够与Pi-ta蛋白的LRD特异结合,提示AVR-Pi-ta(176)蛋白直接结合植物细胞内的Pi-ta LRD区,启动Pi-ta-介导的防御反应(Bryan(2000)Plant Cell 12:2033-46;Jia等人(2000)EMBO J.19:4004-14)。Pi-ta的6个抗性和5个敏感等位基因的比较显示总体氨基酸多态性,只有一个氨基酸决定特异性。
Pi2基因从一个高抗性印度水稻(O.sativa spp.Indica)栽培种5173渐渗到敏感栽培种CO39内,产生的等基因系被命名为C101A51(Mackill和Bonman(1992)Phytopathology 82:746-749)。发现C101A51对在菲律宾不同地区收集的超过200种分离株具有抗性,只对属于谱系44的一个新分离株敏感(Chen等人(1996)Rice Plant Dis.80:52-56)。在其它几个国家的广泛接种试验也表明,Pi2是最广谱的稻瘟病抗性基因之一(H.Leung,International Rice Research Institute,IRRI)。Pi2基因对水稻染色体6作图,发现与RFLP标记RG64紧密连锁(2.1cM)(Yu等人(1991)Theor.Appl.Genet.81:471-476)。Pi9从四倍体野生水稻Oryza minuta(BBCC基因组)渐渗到入良种繁育(elite breeding)系IR31917中(Amante-Bordeos等人(1992)Theor.Appl.Genet.84:345-354)。该基因也对染色体6作图,它与Pi2紧密连锁(Liu等人(2002)Mol.Genet.and Genom.267:472-480)。利用所有的Pi9标记,构建一个高分辨率图谱和横跨Pi2基因座的BAC/TAC重叠群。该重叠群中99kb片段的序列分析显示该区存在6个NBS/LRR基因(NBS 1-6)。遗传和突变分析提示,候选基因之一NBS2是Pi2基因。
实施例1:利用大F2群体中的Pi9连锁标记,对Pi2区的高分辨率作图
为了构建Pi2基因座处的高分辨率图谱,Pi2等基因系C101A51与敏感栽培种CO39杂交产生的超过2000株F2植物接种稻瘟病分离株PO6-6。接种7天后,根据0-5打分系统对植物的感染打分。将总共505株具有典型敏感损伤的植物移植到温室的盆中。移植两周后,从每株植物上收获一片嫩叶(3-4cm长)进行小规模DNA提取。从所有敏感植物中提取DNA。DNA质量和浓度在琼脂糖凝胶上检查,用TE缓冲液调节为约20ng/μl。PCR扩增使用2微升DNA。
表1.在Pi2作图中使用的引物序列
标记  名称  序列 参考文献
RG6  431  GTT GTT TGA GCT CTC CAA TGC CTG TTC Yu et al.1991
 432  CTG CAG TGC AAT GTA CGG CCA GG
NBS1  pi9-p5  AGA GGA AGT GAA TAC ACA CC
 pi9-p6  GCA AAC TGA GCT GGA GAA G
NBS2  pi9-p9  TCT ATA GAA GTG CAA ACA GC
 pi9-p10  TTA GGT ACG AAG ATG AGT AG
NBS4  NBS6-F1  GGT TTC CCA CTC TCT TAC A
 pi9-p12  TCT GTT GCT TCC ACT TCA AC
根据Pi9区处的基因组序列设计5对引物(RG64、NBS1、NBS2、NBS4和NBS6)(表1)。这些引物首先用来筛查C101A51与CO39之间的多态性。NBS1和NBS6引物不能从CO39中扩增一条特异带,而NBS2引物只能从C101A51中扩增一条特异带。NBS4引物从C101A51和CO39中都扩增到带,但是PCR产物的大小不同。对于RG64引物,只在用限制性内切酶HaeIII消化PCR产物后才在两个亲本之间观察到多态性(Hittalmani等人(1995)Theor.Appl.Genet.100:1121-1128)。因此,我们使用NBS2、NBS4和RG64引物筛选总共505株敏感植物。在RG64基因座处发现15个重组子,这与标记与Pi2基因之间2.8cM距离的RFLP作图结果一致(Yu等人(1991)Theor.Appl.Genet.81:471-476)。在另外426株F2植物中,在RFLP标记R2131之间鉴定了8个重组子,表明距Pi2基因的距离为2.7cM。在505株敏感植物中,在Pi2与NBS2或NBS4标记之间未发现重组子。这些结果表明,Pi2与NBS2和NBS4高度连锁。
实施例2:Pi2 BAC和TAC文库的构建
为了构建BAC和TAC文库,从Pi2等基因系C101A51中分离高分子量(HMW)DNA,用限制性内切酶HindIII部分消化。然后利用一个脉冲场凝胶电泳装置大小分离DNA(100-200kb)。从低熔点琼脂糖中纯化的DNA分别与HindIII-消化并去磷酸化的BAC和TAC载体连接。利用细胞穿孔(Porator)系统将连接混合物电穿孔到大肠杆菌DH10B细胞中。两个文库的平均插入大小约为40kb,因为只对部分消化的DNA进行了均一大小的筛选。收集大约200,000个BAC克隆和150,000个TAC克隆,分开贮存在80个BAC库(每个库约5000个克隆)和45个TAC库中(每个库约3000个克隆)。从每个库中分离BAC/TAC质粒DNA,进行PCR和Southern分析。
利用3个引物对(硝酸盐诱导的蛋白质基因,和NBS2和NBS4标记)从两个文库中筛查阳性BAC和TAC克隆。使用来自硝酸盐诱导的蛋白质基因的引物,因为它位于Pi9序列中NBS基因簇的上游。对于3个引物对,从3个BAC库和2个TAC库中扩增预期的带。在菌落和Southern杂交后,获得含有这三个片段的三个单独的BAC(BAC6、23和70)。根据它们的限制消化和Southern杂交图案,证实来自TAC文库的两个阳性克隆(TAC39和TAC40)是同一个克隆,并且与BAC70、BAC23和BAC6重叠。此外,也利用BAC6的正向端作为菌落杂交探针,鉴定了与来自TAC文库的TAC40和BAC6重叠的TAC10。根据HindIII和NotI-消化带的估计,整个重叠群的连续长度约为135kb(图1)。在这些克隆中,证实BAC70含有硝酸盐诱导的蛋白质基因,BAC23含有NBS2和NBS4标记,BAC6含有NBS4标记(图2A)。
实施例3:横跨Pi2基因座的BAC和TAC克隆的鸟枪文库
根据上述结果,选择具有最小重叠的3个克隆(BAC70、TAC40、TAC10)利用鸟枪法测序。利用乙酸铵沉淀法小量制备的BAC和TACDNA,通过超声处理剪切,用T4 DNA聚合酶修复。修复的DNA在琼脂糖凝胶上大小选择,用一个GFX柱(Amersham)纯化。纯化的DNA与一个SmaI-消化并去磷酸化的pBluescript-KS(+)载体连接。用细胞穿孔系统将连接混合物电穿孔到大肠杆菌DH10B细胞内。三个文库的插入大小为1.5kb-2.5kb。挑取白色菌落,在-80℃下贮存在96孔板中以备测序。来自TAC40鸟枪文库的约900个克隆和来自BAC70鸟枪文库的700个克隆从两端测序。利用程序phred/phrap/Consed装配来自TAC40和BAC70的所有序列数据。装配的序列数据表明TAC40的长度为58kb,BAC70为46kb。除去BAC70与TAC40之间的重叠序列后,Pi2区处连续序列的总长度为99,090bp(SEQ ID NO:13)。
实施例4:Pi2序列中的NBS-LRR同源基因簇
为了从基因组序列精确地鉴定开放阅读框(ORF),使用两种不同的方法。首先,利用基因预测程序GenScan1.0获得99kb区中的编码序列骨架。其次,利用使用BLAST程序的同源性搜索修改基因预测结果。在99kb序列中鉴定到硝酸盐诱导的蛋白质(NIP)基因下游的一个抗性基因样簇。在该基因簇中鉴定到6个基因(命名为NBS1-NBS6),它们与克隆到植物种中的NBS/LRR型抗病性基因高度同源(图2B)。在这6个Pi2候选基因中,NBS2(SEQ ID NO:3)和NBS4(SEQ ID NO:7)用相对cDNA的部分序列证实。通过插入一个solo-LTR截短NBS3(SEQ IDNO:5),它显示与水稻gypsy-型反转录转座子RIRE8的LTR在核苷酸序列上有86%的同一性。该solo-LTR显示典型特征,包括复制的GACCG靶序列和TGTCAC的反向重复序列。NBS5(SEQ ID NO:9)似乎是另外一种截短的基因,因为在该编码序列中发现一个大的缺失。NBS6(SEQ ID NO:11)位于序列的右端,该序列向右侧继续延伸。
实施例5:6种Pi2候选基因的序列比较分析
将6种推断的NBS/LRR基因翻译为蛋白质序列。由于NBS3、NBS5和NBS6是截短的或不完全的基因,所以利用BLAST2,用这些基因的同源片段进行序列比较(表2)。在这6种NBS/LRR基因中,NBS2显示与NBS4和NBS6分别有94%和95%的同一性。NBS4和NBS6显示彼此有97%的同一性。
表2.6种NBS/LRR基因的氨基酸序列的比较。序列同一性和相似性分别在上面和下面显示。
NBS2 NBS3 NBS4 NBS5* NBS6*
NBS1 62% 61% 62% 45% 60%
76% 77% 76% 59% 75%
NBS2 63% 93% 42% 94%
77% 94% 57% 95%
NBS3 62% 53% 63%
76% 72% 77%
NBS4 43% 97%
57% 97%
NBS5 76%
76%
*由于NBS5和NBS6是截短的或不完全的,利用它们的核苷酸序列与其它基因进行比较。
**NBS5和NBS6与它们的核苷酸序列比较。
实施例6:候选Pi2基因的cDNA的筛查
在感染稻瘟病分离株PO6-6 12小时和24小时后,用从叶组织中分离的RNA构建cDNA文库。混合这两个时间点的等量RNA,用于mRNA纯化。用纯化的mRNA构建cDNA文库。在检查20个克隆后,cDNA克隆的平均大小为1.5kb,大小范围是0.7kb-2.8kb。将cDNA文库保存在50个库中,总共约500,000个cDNA克隆。通过用NBS2标记作为探针与每个库的EcoRI-消化的质粒DNA杂交,鉴定几个候选库。最后利用菌落杂交鉴定cDNA-45(SEQ ID NO:14)和cDNA-21(SEQ IDNO:15),并与序列确定的NBS4进行匹配。
利用cDNA库的PCR扩增和RT-PCR克隆NBS2和NBS4的完整编码序列。来自NBS2和NBS4的特异性引物根据Pi2区的基因组序列设计(表3,图3)。利用NBS2-p2和M13正向引物,由cDNA库获得cDNA-f3。分别使用引物对NBS2-p1/BAC84R和NBS2-p3/pi2-p5,利用RT-PCR方法扩增cDNA-51、cDNA-52和cDNA-4。对这些cDNA的测序证实,有3个cDNA克隆(cDNA-f3、cDNA-51和cDNA-4)与NBS2基因匹配,cDNA-52与NBS4基因匹配。通过除去这3个cDNA(cDNA-f3、cDNA-51和cDNA-4)之间的重叠序列获得NBS2的完整编码序列。该序列显示为SEQ ID NO:3。
表3.在克隆NBS2和NBS4的cDNA中使用的引物序列
 BAC84F1  TTG AAA GCG AAG AAG ACA TT
 BAC84R1  GAC GAC CAC ATT TAT TTA CA
 NBS2-p1  AAC GAA TCC ATG GCG GAG AC
 NBS2-p2  TGA TAT CAT GAA TTC GAC AAG
 NBS2-p3  AGT TCA GGA AAA CAC TCG CC
 NBS2-p4  CCA TAC CTG TIT TGC AGG AC
 NBS2-p5  GGA GCA TTA TTC GAT CAT TAG
实施例7:用更多标记对Pi2区的精细作图
在Pi2与Pi9区之间发现NBS/LRR基因比对的差异(图4)。根据NBS4设计的用于Pi2遗传作图的引物证实与Pi2中的NBS3匹配。来自Pi9的另外一个标记BAC3R末端也与Pi2中的同一NBS3基因匹配。在Pi2区中只有一个拷贝的NBS3基因,这与Pi9不同。利用PCR方法,在505株敏感植物中,在NBS2和NBS3与Pi2之间未发现重组子。利用杂交法,在另外426株F2植物中,在NBS3与Pi2之间发现一个重组子。为了确定Pi2到NBS3的方向,根据NBS1-NBS6区的序列设计更多PCR引物对。当利用根据BAC6正向端序列设计的引物对筛选505株敏感植物时,鉴定出3个重组子。因此,Pi2基因应当位于NBS3上游,因为BAC6正向端位于NBS3下游。综合以前在NBS1上游区未发现多态性的结果,这些结果确定Pi2是NBS1或NBS2,它们是Pi2区中NIP与NBS3之间仅有的两个基因(图2A)。
实施例8:Pi2植物的突变产生
为了加速Pi2基因的克隆,我们由携带Pi2的栽培种C101A51产生突变系。C101A51种子用γ射线处理,收集10,000个以上的M1系。将各个M2种子播种在土壤中,3周后接种PO6-6。将具有典型敏感症状的植物移植到温室的盆中。两周后从每株植物中提取DNA进行PCR和Southern分析。PCR筛选使用三个特异性引物对(Nip、NBS2和BAC6正向末端)(表3)。PCR分析显示,Nip基因在所有M2植物中均未缺失,而NBS2和BAC6正向末端在所有敏感突变植物中均丢失。有趣的是,两个不同家族的两株抗性植物(25-4和41-2)在三个靶区内没有缺失。
表4.用于分析C101A51突变系的引物序列
基因座 名称  序列
Nip pi9-p4  CAC TGA ATA ACG ACT ACA TC
pi9-p15  ATT GGT GGT TGG GCA TCT AG
Nbs2 pi9-p9  TCT ATA GAA GTG CAA ACA GC
pi9-p10  TTA GGT ACG AAC ATG AGT AG
BAC6F BAC6F-1  TCA TTA AGA TTA AGG AGC CC
BAC6F-2  CAT GGT TGC TAT ATT TTA GG
Nbs1 NBS-LRR-F2  CAC TGT TGT AGC GGA GGA GA
pi2-p2  TTC GAT GGC GTT CAC CAA G
Nbs2-5’ pi2-p8  CCA ATG TCT GCA TAC TCT TC
pi2-p5  ATT CCA ACC TGC AGC AAG AG
Nbs2-3’ BAC84F  TTG AAA GCG AAG AAG ACA TT
pi2-p5  GGA GCA TTA TTC GAT CAT TAG
用系列DNA探针进行杂交分析,以确定C101A51的敏感突变系中的缺失区(表4)。一个区含有42361bp-45301bp的片段,它从NBS1的3′端到NBS2的启动子区(图2B)。在Southern分析中使用在PCR分析中使用的同一组突变植物。当使用NBS1片段作为探针时,所有敏感和抗性突变体都显示与野生型抗性植物C101A51相同的杂交图案。两条杂交带的大小与根据序列限制性酶切图谱测定的相同。然而,从53221bp到54023bp的NBS2基因的3′区在所有敏感M2植物中都缺失,但是在抗性植物中未缺失(图2B)。使用另外一个51894bp到54023bp的NBS2探针确定位于NBS2基因区的缺失位点(图2B)。野生型抗性植物C101A51和来自突变系的抗性植物显示相同的杂交图案:杂交带在大小上与根据序列的限制性酶切图谱确定的相同。来自突变系的敏感植物显示一条1.6kb的较小带,在野生型植物C101A51中没有2.8kb的带。据推断,NBS2基因中的缺失位点位于52891bp与55674bp之间,这使2.8kb的带变成1.6kb。也利用反向PCR克隆了横跨该缺失位点的片段。缺失连接连接的序列证实,缺失区在NBS2基因中部开始。综合PCR分析结果,推断已知突变体的缺失区位于NBS2与BAC6正向端之间,NBS1不是Pi2候选基因之一,因为它在所有敏感突变植物中都是完整的。
结合高分辨率作图和突变分析结果,推断NBS2是Pi2候选基因。
实施例9:NBS-1与Pib之间的序列保守以及NBS2(Pi2)内的保守元件
根据前面实验中获得的6个NBS基因NBS1-6,在这些基因与克隆的稻瘟病抗性基因Pib的预测氨基酸序列之间进行多重蛋白质序列比对。图4显示这一比对的结果,显示高序列保守区。
图10中也指出了NBS2(Pi2)基因内的保守元件,图中显示该基因中存在一个NB-ARC结构域,从约氨基酸144-约氨基酸465,而该基因中含有一个LRR结构域,从约氨基酸534-约氨基酸951。
实施例10:转基因植物的转化和再生
来自温室供体植物的未成熟的玉米胚芽用一种质粒轰击,该质粒含有与一个适当启动子和选择性标记基因PAT有效连接的本发明的Pi2-样DNA序列(Wohlleben等人(1988)Gene 70:25-37),PAT提供对除草剂Bialaphos的抗性。此外,选择性标记基因也在一种不同的质粒上存在。转化如下所述进行。培养基配方如下。
靶组织的制备
将穗脱壳,在30%Clorox漂白液+0.5%Micro去污剂中表面灭菌20分钟,用无菌水漂洗两次。切下未成熟的胚芽,以每个平板25个胚芽,将胚芽轴侧向下(盾片侧向上)放置于560Y培养基上4小时,然后排列在2.5-cm靶区内准备进行轰击。
DNA的制备
制备一种质粒载体,其含有与适当启动子有效连接的Pi2-样DNA。利用如下的CaCl2沉淀法,将该质粒DNA+含有一个PAT选择性标记的质粒DNA沉淀于1.1μm(平均直径)钨沉淀上:
100μl在水中制备的钨颗粒
10μl(1μg)DNA,在Tris EDTA缓冲液(1μg总DNA)中
100μl 2.5M CaCl2
10μl 0.1M亚精胺
向钨颗粒悬液中连续加入各种试剂,置于多试管振荡器上。短暂超声处理终混合物,在恒速振荡下温育10分钟。沉淀后,短暂离心试管,除去液体,用500ml 100%乙醇洗涤,离心30秒。再次除去液体,向终钨颗粒沉淀中加入105μl 100%乙醇。对于基因枪轰击,短暂超声处理钨/DNA颗粒,将10μl点样到每个巨载体的中心,使之干燥约2分钟,之后轰击。
基因枪处理
样品平板用基因枪#HE34-1或#HE34-2以水平#4轰击。所有样品都接受一次650 PSI的轰击,从每管制备的颗粒/DNA中采集总共10等份。
随后的处理
轰击后,将胚芽置于560Y培养基上2天,然后转移到含有3mg/LBialaphos的560R选择培养基上,每两周传代培养一次。筛选约10周后,将选择抗性愈伤组织克隆转移到288J培养基中,开始植物再生。在体细胞胚成熟后(2-4周),将发育良好的体细胞胚转移到培养基上进行萌芽,并且转移到有光照的培养室中。约7-10天后,将发育的小植物转移到试管中的272V不含激素培养基中7-10天,直到小植物良好地生长。然后将植物转移到含有盆栽土的平地上的插件上(相当于2.5″盆),在生长室中生长一周,随后在温室中再生长1-2周,然后转移到标准600盆中(1.6加仑),生长至成熟。监测植物,根据Pi2-样DNA活性打分。
轰击和培养基
轰击培养基(560Y)含有4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/lEriksson′s维生素混合物(1000×SIGMA-1511)、0.5mg/l盐酸硫胺素、120.0g/l蔗糖、1.0mg/l 2,4-D和2.88g/l L-脯氨酸(用D-I H2O补充体积,随后用KOH调节为pH 5.8);2.0g/l Gelrite(用D-I H2O补充体积后添加);和8.5mg/l硝酸银(在灭菌培养基并冷却至室温后添加)。选择性培养基(560R)含有4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/lEriksson′s维生素混合物(1000×SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖和2.0mg/l 2,4-D(用D-I H2O补充体积,随后用KOH调节为pH 5.8);3.0g/l Gelrite(用D-I H2O补充体积后添加);和0.85mg/l硝酸银和3.0mg/l bialaphos(都在灭菌培养基并冷却至室温后添加)。
植物再生培养基(288J)含有4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素贮存溶液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆素和0.40g/l甘氨酸,用polished D-I H2O补充体积)(Murashige和Skoog(1962)Physiol.Plant.15:473)、100mg/l肌-肌醇、0.5mg/l玉米素、60g/l蔗糖和1.0ml/l 0.1mM脱落酸(在调节为pH 5.6后用polished D-I H2O补充体积);3.0g/l Gelrite(用D-I H2O补充体积后添加);和1.0mg/l吲哚乙酸和3.0mg/l bialaphos(在灭菌培养基并冷却至60℃后添加)。不含激素的培养基(272V)含有4.3g/l MS盐(GIBCO11117-074)、5.0ml/l MS维生素贮存溶液(0.100g/l烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆素和0.40g/l甘氨酸,用polished D-I H2O补充体积)、0.1g/l肌-肌醇和40.0g/l蔗糖(在调节为pH 5.6后用polishedD-I H2O补充体积);和6g/l细菌培养用琼脂(用polished D-I H2O补充体积后添加),灭菌,冷却到60℃。
实施例11:土壤杆菌介导的转化
为了用本发明的Pi2-样基因土壤杆菌介导地转化玉米,优选地采用Zhao的方法(美国专利号5,981,840和PCT专利公开文本WO98/32326;其内容在此引用作为参考)。简言之,从玉米上分离未成熟的胚芽,胚芽接触一种土壤杆菌悬液,其中细菌能够将Pi2-样基因转移到至少一个未成熟胚芽的至少一个细胞中(步骤1:感染步骤)。在该步骤中,未成熟的胚芽优选地浸没于一种土壤杆菌悬液中,开始接种。这些胚芽与土壤杆菌共培养一段时间(步骤2:共培育步骤)。优选地,在感染步骤后,未成熟的胚芽在固体培养基上培养。在共培育阶段后,涉及一个任选的“静止”步骤。在这个静止步骤中,胚芽在至少一种抗生素存在下温育,已知该抗生素不需添加植物转化子的选择剂即可抑制土壤杆菌的生长(步骤3:静止步骤)。优选地,未成熟的胚芽在含有抗生素但是不含选择剂的固体培养基上培养,以除去土壤杆菌,持续感染细胞的静止阶段。然后,接种的胚芽在含有一种选择剂的培养基上培养,回收生长的转化的愈伤组织(步骤4:选择步骤)。优选地,未成熟的胚芽在含有一种能够导致转化细胞选择性生长的选择剂的固体培养基上生长。该愈伤组织然后再生为植物(步骤5:再生步骤),优选地,在选择性培养基上生长的愈伤组织在固体培养基上培养,再生为植物。
实施例12:大豆胚芽转化
大豆胚芽用一种质粒轰击,该质粒含有与如下一种适当启动子有效连接的本发明的一种Pi2-样基因。为了诱导体细胞胚,从大豆栽培种A2872的表面灭菌的未成熟种子上切下的长度为3-5mm的子叶在适当琼脂培养基上培养,在光线或暗处,在26℃下,6-10周。然后切下产生次生胚的体细胞胚,置于一种适当的液体培养基中。在重复筛选扩增为早期球形阶段胚芽的体细胞胚簇后,悬液如下所述保持。
大豆胚发生悬浮培养物能够在旋转摇床上保持在35ml液体培养基中,150rpm,26℃,以16∶8小时日/夜时间表进行花期光照。通过接种约35mg组织到35ml液体培养基中,培养物每两周传代培养一次。
然后可以用基因枪轰击法转化大豆胚发生悬浮培养物(Klein等人(1987)Nature(London)327:70-73,美国专利号4,945,050)。这些转化能够使用一种Du Pont Biolistic PDS1000/HE仪器(氦改型)。
能够用来促进大豆转化的一种选择性标记是一种转基因,它包含来自花椰菜花叶病毒的35S启动子(Odell等人(1985)Nature313:810-812)、来自质粒pJR225的潮霉素磷酸转移酶基因(来自大肠杆菌;Gritz等人(1983)Gene 25:179-188)和来自根癌土壤杆菌Ti质粒的T-DNA的胭脂氨酸合酶基因的3′区。含有与一种适当启动子有效连接的Pi2-样基因的表达盒能够分离为一个限制性酶切片段。该片段然后能够插入携带标记基因的载体的独特限制性酶切位点内。
向50μl 60mg/ml 1μm金颗粒悬液中(依次)加入:5μl DNA(1μg/μl)、20μl亚精胺(0.1M)和50μl CaCl2(2.5M)。颗粒制剂然后搅拌3分钟,在微量离心机中离心10秒钟,除去上清液。DNA包被的颗粒然后在400μl 70%乙醇中洗涤一次,重悬浮于40μl无水乙醇中。DNA/颗粒悬液能够超声处理3次,每次1秒钟。然后将5微升DNA包被的金颗粒加到每个巨载体盘上。
将约300-400mg两周的悬浮培养物置于一个60×15mm空培养皿中,用移液管从组织中除去残余的液体。对于每次转化实验,通常轰击约5-10个组织平板。膜破坏压力设置为1100psi,容器抽真空为28英寸汞柱的真空。组织放置在距阻滞筛约3.5英寸处,轰击3次。轰击后,组织可以对半切开,放回液体中,如上所述培养。
轰击5-7天后,液体培养基可以更换为新鲜培养基,轰击11-12天后,更换为含有50mg/ml潮霉素的新鲜培养基。该选择性培养基能够每周更新。轰击7-8周后,可以观察到从未转化的坏死胚发生簇中生长出转化的绿色组织。取下分离的绿色组织,接种各个摇瓶,产生新的、无性繁殖的、转化的胚发生悬浮培养物。每个新系都可以作为独立的转化事件处理。这些悬液然后可以传代培养,保持为未成熟的胚芽簇,或者通过各个体细胞胚的成熟和萌芽再生为整个植物。
实施例13:向日葵分生组织转化
向日葵分生组织用一种表达盒转化,该表达盒含有与如下一种适当启动子有效连接的本发明的一种Pi2-样基因(参见欧洲专利号EP 0486233,在此引用作为参考,和Malone-Schoneberg等人(1994)PlantScience 103:199-207)。成熟的向日葵种子(Helianthus annuus L.)用单小麦头脱粒机脱壳。种子在每50ml溶液添加两滴Tween 20的20%Clorox漂白溶液中表面灭菌30分钟。用无菌蒸馏水漂洗种子两次。
利用Schrammeijer等人(Schrammeijer等人(1990)Plant Cell Rep.9:55-60)所述的一种改进方法制备分裂的胚轴外植体。在表面灭菌后,种子在蒸馏水中浸渗60分钟。然后破裂每个种子的子叶,在胚轴的平面上产生一个干净的断裂面。在切下根尖后,外植体在初叶之间纵向对切。两个半部分切面向上置于GBA培养基上,该培养基含有Murashige和Skoog的矿质元素(Murashige等人(1962)Physiol.Plant.15:473-497)、Shepard′s维生素添加剂(Shepard(1980)in Emergent Techniques for theGenetic Improvement of Crops(University of Minnesota Press,St.Paul,Minnesota)、40mg/l硫酸腺嘌呤、30g/l蔗糖、0.5mg/l 6-苄基-氨基嘌呤(BAP)、0.25mg/l吲哚-3-乙酸(IAA)、0.1mg/l赤霉酸(GA3),pH 5.6和8g/l Phytagar。
外植体在土壤杆菌处理前进行微粒轰击(Bidney等人(1992)PlantMol.Biol.18:301-313)。对于该处理,30-40个外植体以环形置于60×20mm板的中央。约4.7mg 1.8mm钨微粒重悬浮于25ml无菌TE缓冲液中(10mM Tris HCl,1mM EDTA,pH 8.0),每次轰击使用1.5ml等份。在一个PDS 1000颗粒加速装置中,通过置于样品上2cm的一个150mm nytex筛,对每块板轰击两次。
在所有转化实验中都使用去攻击性的根癌土壤杆菌EHA105株。通过如Holster等人(1978)Mol.Gen.Genet.163:181-187所述的冻融,向土壤杆菌EHA105株中引入一种含有表达盒的二元质粒载体,该表达盒含有与一种适当的启动子有效连接的Pi2-样基因。该质粒还含有一个卡那霉素选择性标记基因(即nptII)。植物转化实验使用的细菌在含有细菌菌株和二元质粒保持所需的适当抗生素的液体YEP培养基(10gm/l酵母提取物,10gm/l细菌用蛋白胨和5gm/l NaCl,pH 7.0)中生长过夜(28℃和100RPM连续搅拌)。当OD600达到0.4-0.8时使用该悬液。沉淀土壤杆菌细胞,以0.5的终OD600重悬浮于一种接种培养基中,该培养基含有12.5mM MES pH 5.7、1gm/l NH4Cl和0.3gm/l MgSO4
将新轰击的外植体置于一种土壤杆菌悬液中,混合,静置30分钟。然后将外植体转移到GBA培养基中,切面向下共培养,26℃18小时天。共培养3天后,将外植体转移到添加了250mg/l头孢噻肟和50mg/l硫酸卡那霉素的374B中(GBA培养基,缺乏生长调节剂,蔗糖水平降低1%)。外植体选择培养2-5周,然后转移到缺乏卡那霉素的新鲜374B培养基中,继续发育1-2周。将含有分化的、抗生素抗性生长区、不产生适合切下的嫩芽的外植体转移到含有250mg/l头孢噻肟的GBA培养基中,进行第二次3天的植物激素处理。通过ELISA测定来自卡那霉素抗性绿色嫩芽的叶样品中NPTII的存在,并使用如Liu等人.Mol.Gen.Genet(2000)267:472-480所述的测定,通过测定Pi2-样蛋白质活性测定转基因表达的存在。
将NPTII-阳性嫩芽移植到Pioneer杂种6440体外生长的向日葵幼苗根状茎上。表面灭菌的种子在48-0培养基(半强度Murashige和Skoog盐、0.5%蔗糖、0.3%gelrite,pH 5.6)中萌芽,在所述外植体培养条件下生长。去掉幼苗的上部分,在下胚轴中制备一个1cm的垂直切口,将转化的嫩芽插入该切口中。为了保护嫩芽,整个区域用石蜡膜包好。移植的植物能够在体外培养一周后转移到土壤中。土壤中的移植物保持在高湿度条件下,随后缓慢适应温室环境。在温室中成熟的T0植物(亲代)的转化扇区通过NPTII ELISA鉴定,并且/或者通过叶提取物的Pi2-样蛋白质活性分析鉴定,而从NPTII-阳性T0植物上收获的转基因种子通过干种子子叶小部分的Pi2-样蛋白质活性分析鉴定。
一种备选向日葵转化方案可以不使用化学选择压力回收转基因子代。将种子脱壳,在每100ml溶液添加2-3滴Tween 20的20%Clorox漂白溶液中表面灭菌20分钟,  然后用蒸馏水漂洗3次。灭菌的种子在用水湿润的滤纸上浸渗,在暗处,26℃下20小时。取下子叶和根radical,分生组织外植体在暗处在374E(GBA培养基,含有MS盐、Shepard维生素、40mg/l硫酸腺嘌呤、3%蔗糖、0.5mg/l 6-BAP、0.25mg/l IAA、0.1mg/l GA和0.8%Phytagar,pH 5.6)上培养24小时。取下初生叶,暴露顶端分生组织,约40个外植体以2cm环形顶端向上地置于374M(含有1.2%Phytagar的GBA培养基)中心,然后在暗处在培养基上培养24小时。
约18.8mg 1.8μm钨颗粒重悬浮于150μl无水乙醇中。超声处理后,将8μl滴到巨载体表面中心处。在26mm Hg氦枪真空下,每个平板用第一个架子上的650psi破裂片轰击两次。
通过如上所述的冻融,将目标质粒引入根癌土壤杆菌EHA105株中。在50μg/l卡那霉素存在下,在一种液体YEP培养基(10g/l酵母提取物、10g/l细菌用蛋白胨和5g/l NaCl,pH 7.0)中28℃过夜培养的细菌的沉淀重悬浮于一种接种培养基中(12.5mM 2-mM 2-(N-吗啉代)乙磺酸、MES、1g/l NH4Cl和0.3g/l MgSO4,pH 5.7),达到OD600为4.0的终浓度。将颗粒轰击的外植体转移到GBA培养基(374E)中,将一小滴细菌悬液直接加到分生组织顶部。外植体在培养基上共培育4天,之后将外植体转移到374C培养基中(GBA,含有1%蔗糖,不含BAP、IAA、GA3,补充了250μg/ml头孢噻肟)。小植物在16小时天和26℃温育条件下在培养基上培养约2周。
利用本领域公知的测定(参见,例如Liu等人.Mol.Gen.Genet(2000)267:472-480所述的测定),根据Pi2-样蛋白质活性筛选在374C培养基中培养两周产生的外植体(约2cm长)。在鉴定阳性(即对于Pi2-样蛋白质表达)外植体后,去掉那些不显示Pi2-样蛋白质活性的嫩芽,将每个阳性外植体再分成结节外植体。一个结节外植体至少含有一个潜在的结节。结节部分在GBA培养基上培养3-4天,以促进从每个结节形成辅芽(auxiliary bud)。然后将其转移到374C培养基中,使之再发育4周。分离发育的芽,在374C培养基上再培养4周。再通过适当的蛋白质活性测定筛选合并的来自每个新回收的嫩芽的叶组织。此时,从单结节中回收的阳性嫩芽通常富含在结节培养前的最初测定中检测到的转基因部分。
将回收的Pi2样蛋白质表达阳性的嫩芽移植到Pioneer杂种6440体外生长的向日葵幼苗根状茎中。根状茎以下列方式制备。将种子去壳,在每100ml溶液添加2-3滴Tween 20的20%Clorox漂白溶液中表面灭菌20分钟,用蒸馏水漂洗3次。灭菌的种子在用水湿润的滤纸上萌芽3天,然后将其转移到48培养基内(半强度MS盐、0.5%蔗糖、0.3%gelrite pH 5.0),在暗处在26℃下生长3天,然后在16-小时-天培养条件下温育。切下选择的幼苗的上部分,在每个下胚轴中制备一个垂直切口,将转化的嫩芽插入一个V-切口中。切口区用石蜡膜包好。在培养基上培养1周后,将移植的植物转移到土壤中。在前两周,它们保持在高湿度条件下,以适应温室环境。
实施例14:通过稳定水稻转化对Pi2的功能分析
由携带Pi2的C101A51系的叶组织制备一个含有约100,000个克隆的TAC文库。鉴定出含有Pi2候选基因序列的几个阳性克隆。克隆之一TAC40用AscI消化,并且自身连接。获得一个亚克隆,它被设计为C2构建体,含有一个32kb的片段,用于通过土壤杆菌介导的方法转化敏感栽培种TP309。该片段含有NBS2和NBS3以及NBS1和NBS4的部分序列。发育为总共12个独立的T0转基因系,有4个系观察到与稻瘟病分离株PO-6-6有3∶1的分离比(抗性比敏感)(数据未显示)。在Southern blot分析中,抗性表型也与Pi2转基因完美地共分离。根据高分辨率作图、突变和转基因分析的结果,我们的结论是,NBS2是Pi2基因。
本说明书中提到的所有公开文本和专利申请都表示本发明所属领域技术人员的水平。所有公开文本和专利申请均在此引用作为参考,如同每个公开文本和专利申请具体、单独地在此引用作为参考。
尽管为了便于理解,已经通过举例说明和实施例详细地描述了前述发明,但是显然,某些改变和修饰可以在权利要求书的范围内实施。
                             序列表
<110>Wang
<120>广谱抗性基因Pi2的克隆与表征
<130>035718/268738
<140>US03/
<141>2003-09-08
<150>60/455,713
<151>2003-03-18
<150>60/409,216
<151>2002-09-09
<160>15
<170>FastSEQ for Windows Version 4.0
<210>1
<211>2982
<212>DNA
<213>Oryza minuta
<220>
<221>CDS
<222>(1)...(2982)
<400>1
atg gcg gcg gag acg gtg gtg agc atg gcg atg tcg gtg ctg ggc agc    48
Met Ala Ala Glu Thr Val Val Ser Met Ala Met Ser Val Leu Gly Ser
 1               5                   10                  15
gcc gtc ggg aag gcc gcc tcc gcc gcc gcc gac gag gcc acc ctc ctg    96
Ala Val Gly Lys Ala Ala Ser Ala Ala Ala Asp Glu Ala Thr Leu Leu
             20                  25                  30
ctc ggc atc cag aag gag atc tgg tac atc aag gac gag ctg aaa act    144
Leu Gly Ile Gln Lys Glu Ile Trp Tyr Ile Lys Asp Glu Leu Lys Thr
         35                  40                  45
att cag gca ttc tta aga gct gct gaa gta aca aag aag aaa gat gac    192
Ile Gln Ala Phe Leu Arg Ala Ala Glu Val Thr Lys Lys Lys Asp Asp
     50                  55                  60
ttg cta aag gta tgg gca gag caa gta cga gat ctg tca tat aac att    240
Leu Leu Lys Val Trp Ala Glu Gln Val Arg Asp Leu Ser Tyr Asn Ile
 65                  70                  75                  80
gaa gat tgc cta gac gaa ttc aag gtt cat gtt gag agc caa agc ttg    288
Glu Asp Cys Leu Asp Glu Phe Lys Val His Val Glu Ser Gln Ser Leu
                 85                  90                  95
gca aag caa cta atg aag ctt ggt gaa cgc cat cga att gct gta cag    336
Ala Lys Gln Leu Met Lys Leu Gly Glu Arg His Arg Ile Ala Val Gln
            100                 105                 110
att cgc aac tta aaa tca aga att gaa gaa gtg agc aac agg aat aca    384
Ile Arg Asn Leu Lys Ser Arg Ile Glu Glu Val Ser Asn Arg Asn Thr
        115                 120                 125
cgc tac agc tta atc aag ccc att tcc tct ata acc aca gag gat gag    432
Arg Tyr Ser Leu Ile Lys Pro Ile Ser Ser Ile Thr Thr Glu Asp Glu
    130                 135                 140
agg gat tcc tac cta gaa gat gct cgc aat cga tca ggt agc aac act    480
Arg Asp Ser Tyr Leu Glu Asp Ala Arg Asn Arg Ser Gly Ser Asn Thr
145                 150                 155                 160
gac gag tca gaa ctt gtg ggc ttt gcc aag act aaa gat gag ttg ctt    528
Asp Glu Ser Glu Leu Val Gly Phe Ala Lys Thr Lys Asp Glu Leu Leu
                165                 170                 175
aaa ctg ata gat gtc aat act aat gac ggt cca gct aaa gtg ata tgt    576
Lys Leu Ile Asp Val Asn Thr Asn Asp Gly Pro Ala Lys Val Ile Cys
            180                 185                 190
gtg gtt ggt atg ggt gga tta ggc aag act acc ctt gca agg aag gca    624
Val Val Gly Met Gly Gly Leu Gly Lys Thr Thr Leu Ala Arg Lys Ala
        195                 200                 205
tat gaa aac aag gaa cac atg aag aac ttc tcg tgt tgt gct tgg atc    672
Tyr Glu Asn Lys Glu His Met Lys Asn Phe Ser Cys Cys Ala Trp Ile
    210                 215                 220
act gtg tct cag tca ttt gac agg aaa gaa att ctg aaa caa atg atc    720
Thr Val Ser Gln Ser Phe Asp Arg Lys Glu Ile Leu Lys Gln Met Ile
225                 230                 235                 240
agg caa ctt ctg ggt gct gat tca tta gac aaa ctc ttg aaa gaa ttt    768
Arg Gln Leu Leu Gly Ala Asp Ser Leu Asp Lys Leu Leu Lys Glu Phe
                245                 250                 255
agt gag aag ttg ctc gtg caa gtc cag cat ctc gct gat cac ttg gtt    816
Ser Glu Lys Leu Leu Val Gln Val Gln His Leu Ala Asp His Leu Val
            260                 265                 270
gaa ggg cta aag gag aaa agg tac ttt gtt gtc ctt gat gac cta tgg    864
Glu Gly Leu Lys Glu Lys Arg Tyr Phe Val Val Leu Asp Asp Leu Trp
        275                 280                 285
acc ata gat gca tgg aat tgg att cat gat att gct ttt ccg aag att    912
Thr Ile Asp Ala Trp Asn Trp Ile His Asp Ile Ala Phe Pro Lys Ile
    290                 295                 300
aac aac aga ggt agt cgc ata ata ata aca acg cga gat gct ggc tta    960
Asn Asn Arg Gly Ser Arg Ile Ile Ile Thr Thr Arg Asp Ala Gly Leu
305                 310                 315                 320
gct gga agg tgt acc tct gaa tca ctt att tac cac ctt gaa ccg tta    1008
Ala Gly Arg Cys Thr Ser Glu Ser Leu Ile Tyr His Leu Glu Pro Leu
                325                 330                 335
cat ata gat gat gct ata cac ttg cta cta gca aag aca aac ata aga    1056
His Ile Asp Asp Ala Ile His Leu Leu Leu Ala Lys Thr Asn Ile Arg
        340                 345                 350
ctt gaa gac atg gaa aat gat gag gac ttg ggc agc ata gtt aca aaa    1104
Leu Glu Asp Met Glu Asn Asp Glu Asp Leu Gly Ser Ile Val Thr Lys
        355                 360                 365
ttg gtg aaa agg tgt ggt tat tta ccg ctg gct ata ctc aca ata gga    1152
Leu Val Lys Arg Cys Gly Tyr Leu Pro Leu Ala Ile Leu Thr Ile Gly
    370                 375                 380
ggc att ctt gct act aag aag ata atg gag tgg gga aaa ttt tac aga    1200
Gly Ile Leu Ala Thr Lys Lys Ile Met Glu Trp Gly Lys Phe Tyr Arg
385                 390                 395                 400
gaa ctt cct tca gag ctt gag agc aat cca agc cta gaa gcc atg agg    1248
Glu Leu Pro Ser Glu Leu Glu Ser Asn Pro Ser Leu Glu Ala Met Arg
                405                 410                 415
agg atg gtg acc cta agc tac aat cac tta cca tct cat ctt aaa cca    1296
Arg Met Val Thr Leu Ser Tyr Asn His Leu Pro Ser His Leu Lys Pro
            420                 425                 430
tgc ttt ctt tac cta agt att ttc cct gaa gat ttt gaa att caa aga    1344
Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Gln Arg
        435                 440                 445
ggg cgc ctg gta gat aga tgg ata gca gag ggt ttt gtc aga gcc aca    1392
Gly Arg Leu Val Asp Arg Trp Ile Ala Glu Gly Phe Val Arg Ala Thr
    450                 455                 460
gat ggg gtg aac att gag gat gtt gga aat agt cac ttt aat gag ctt    1440
Asp Gly Val Asn Ile Glu Asp Val Gly Asn Ser His Phe Asn Glu Leu
465                 470                 475                 480
atc aac aga agt ctg att cag ccc tca aaa gtt agt aca gat gga gtt    1488
Ile Asn Arg Ser Leu Ile Gln Pro Ser Lys Val Ser Thr Asp Gly Val
                485                 490                 495
gtt aag aga tgt cga atc cat gat atc atg cgt gat atc ata gtt tca    1536
Val Lys Arg Cys Arg Ile His Asp Ile Met Arg Asp Ile Ile Val Ser
            500                 505                 510
att tct aga gag gaa aat ttt gtg ctg ttg act agg gag aag atc act    1584
Ile Ser Arg Glu Glu Asn Phe Val Leu Leu Thr Arg Glu Lys Ile Thr
        515                 520                 525
gtt gta gcg gag gag agc atc cgc cat cta gca ttt cat ggg agc aaa    1632
Val Val Ala Glu Glu Ser Ile Arg His Leu Ala Phe His Gly Ser Lys
    530                 535                 540
tgc tca aag ata tgc ttg gag tgg aac cat ctg cgc tca gta act ttg    1680
Cys Ser Lys Ile Cys Leu Glu Trp Asn His Leu Arg Ser Val Thr Leu
545                 550                 555                 560
ttt ggc gac aga cct gtg ggg cga aca cct gca ctt tgt tca cca caa    1728
Phe Gly Asp Arg Pro Val Gly Arg Thr Pro Ala Leu Cys Ser Pro Gln
                565                 570                 575
ttt agg atg ctg aga gtg ttg gat ctg gaa gat gca aaa ttc aaa ttc    1776
Phe Arg Met Leu Arg Val Leu Asp Leu Glu Asp Ala Lys Phe Lys Phe
            580                 585                 590
aca caa aat gat atc aga aat ata ggg ttg ttg cgc cac atg aaa tat    1824
Thr Gln Asn Asp Ile Arg Asn Ile Gly Leu Leu Arg His Met Lys Tyr
        595                 600                 605
ttg aat ttt gca aga gcc tca act att tat aca ctt cca agg tcc ata    1872
Leu Asn Phe Ala Arg Ala Ser Thr Ile Tyr Thr Leu Pro Arg Ser Ile
    610                 615                 620
gga aaa ttg cag tgc ttg caa att ttg aac atg agg gag gca aat atc    1920
Gly Lys Leu Gln Cys Leu Gln Ile Leu Asn Met Arg Glu Ala Asn Ile
625                 630                 635                 640
tca gca cta aca act gag gtg act aaa ctc cag aat ctc cgt agc ctc    1968
Ser Ala Leu Thr Thr Glu Val Thr Lys Leu Gln Asn Leu Arg Ser Leu
                645                 650                 655
cga tgc agc agg agg tct ggt tct ggt tac ttt agc ata ata gat aat    2016
Arg Cys Ser Arg Arg Ser Gly Ser Gly Tyr Phe Ser Ile Ile Asp Asn
            660                 665                 670
ccc aag gaa tgc ttg atg atc acc atg tgc tta ccg atg gtt ttc tta    2064
Pro Lys Glu Cys Leu Met Ile Thr Met Cys Leu Pro Met Val Phe Leu
        675                 680                 685
act tca ata aat ttc agt gac cgt gtg aag tta att cct gag ata tgc    2112
Thr Ser Ile Asn Phe Ser Asp Arg Val Lys Leu Ile Pro Glu Ile Cys
    690                 695                 700
atg tca tgt tct acc cgt tgg tct gat aca aag ggt gtg agg gtg cca    2160
Met Ser Cys Ser Thr Arg Trp Ser Asp Thr Lys Gly Val Arg Val Pro
705                 710                 715                 720
aga gga att gac aac cta aaa gag tta cag att cta gaa gtc gtg gac    2208
Arg Gly Ile Asp Asn Leu Lys Glu Leu Gln Ile Leu Glu Val Val Asp
                725                 730                 735
atc aac aga act agt agg aag gcg att gaa gag ctg ggg gag cta att    2256
Ile Asn Arg Thr Ser Arg Lys Ala Ile Glu Glu Leu Gly Glu Leu Ile
            740                 745                 750
cag tta aga aaa tta agc gtg aca aca aaa ggc gcc aca aat aag aag    2304
Gln Leu Arg Lys Leu Ser Val Thr Thr Lys Gly Ala Thr Asn Lys Lys
        755                 760                 765
tat cag ata ttt tgt gca gcg att gag aag ctc tct tct ctg caa tct    2352
Tyr Gln Ile Phe Cys Ala Ala Ile Glu Lys Leu Ser Ser Leu Gln Ser
    770                 775                 780
ctc cgt gtg gat gct gag gga ttc tca gat act gga aca ctt gag tgg    2400
Leu Arg Val Asp Ala Glu Gly Phe Ser Asp Thr Gly Thr Leu Glu Trp
785                 790                 795                 800
ctc aat tcg att gca tgt cct cct cca ttc ttg aag aga ctc aag ttg    2448
Leu Asn Ser Ile Ala Cys Pro Pro Pro Phe Leu Lys Arg Leu Lys Leu
                805                 810                 815
aat gga tct ctt gca gat aca cca aac tgg ttt ggg aac ctt aag cag    2496
Asn Gly Ser Leu Ala Asp Thr Pro Asn Trp Phe Gly Asn Leu Lys Gln
            820                 825                 830
ctg gtg aag atg tgc tta tcc aga tgt ggg cta aaa gat ggt aaa act    2544
Leu Val Lys Met Cys Leu Ser Arg Cys Gly Leu Lys Asp Gly Lys Thr
        835                 840                 845
atg gag ata ctt ggg gca ctg ccc aac ctt atg gtt ctt cgt ctt tat    2592
Met Glu Ile Leu Gly Ala Leu Pro Asn Leu Met Val Leu Arg Leu Tyr
    850                 855                 860
cgc aac gca tat gct gac gag aaa atg aca ttc aga agg gga act ttc    2640
Arg Asn Ala Tyr Ala Asp Glu Lys Met Thr Phe Arg Arg Gly Thr Phe
865                 870                 875                 880
cca aat ctc agg tgt ctt gat att tac ttg ctg aag caa ctt aga gag    2688
Pro Asn Leu Arg Cys Leu Asp Ile Tyr Leu Leu Lys Gln Leu Arg Glu
                885                 890                 895
ata aga ttt gag gag ggc acc tcg cca acg atg gaa agt ata gaa att    2736
Ile Arg Phe Glu Glu Gly Thr Ser Pro Thr Met Glu Ser Ile Glu Ile
            900                 905                 910
tat ggt tgc agg ttg gaa tca ggg att att ggt atc aag cac ctt cca    2784
Tyr Gly Cys Arg Leu Glu Ser Gly Ile Ile Gly Ile Lys His Leu Pro
        915                 920                 925
aga ctt aag att att tcg ctt gaa tat gat ggt aaa gtc gcg aag Gtt    2832
Arg Leu Lys Ile Ile Ser Leu Glu Tyr Asp Gly Lys Val Ala Lys Leu
    930                 935                 940
gat gtg ctg caa gag gaa gtg aat aca cac ccc aat cat act gaa ttg    2880
Asp Val Leu Gln Glu Glu Val Asn Thr His Pro Asn His Thr Glu Leu
945                 950                 955                 960
caa atg gca gag gat cga agt cat cat gac cta gga ggc ctt gca tct    2928
Gln Met Ala Glu Asp Arg Ser His His Asp Leu Gly Gly Leu Ala Ser
                965                 970                 975
gat ggc gat gat gcc cat gac aat cca gcg ttg cgc tat caa aca tca    2976
Asp Gly Asp Asp Ala His Asp Asn Pro Ala Leu Arg Tyr Gln Thr Ser
            980                 985                 990
tgt tga                                                            2982
Cys  *
<210>2
<211>993
<212>PRT
<213>Oryza minuta
<400>2
Met Ala Ala Glu Thr Val Val Ser Met Ala Met Ser Val Leu Gly Ser
 1               5                  10                  15
Ala Val Gly Lys Ala Ala Ser Ala Ala Ala Asp Glu Ala Thr Leu Leu
            20                  25                  30
Leu Gly Ile Gln Lys Glu Ile Trp Tyr Ile Lys Asp Glu Leu Lys Thr
        35                  40                  45
Ile Gln Ala Phe Leu Arg Ala Ala Glu Val Thr Lys Lys Lys Asp Asp
    50                  55                  60
Leu Leu Lys Val Trp Ala Glu Gln Val Arg Asp Leu Ser Tyr Asn Ile
65                  70                  75                  80
Glu Asp Cys Leu Asp Glu Phe Lys Val His Val Glu Ser Gln Ser Leu
                85                  90                  95
Ala Lys Gln Leu Met Lys Leu Gly Glu Arg His Arg Ile Ala Val Gln
            100                 105                 110
Ile Arg Asn Leu Lys Ser Arg Ile Glu Glu Val Ser Asn Arg Asn Thr
        115                 120                 125
Arg Tyr Ser Leu Ile Lys Pro Ile Ser Ser Ile Thr Thr Glu Asp Glu
    130                 135                 140
Arg Asp Ser Tyr Leu Glu Asp Ala Arg Asn Arg Ser Gly Ser Asn Thr
145                 150                 155                 160
Asp Glu Ser Glu Leu Val Gly Phe Ala Lys Thr Lys Asp Glu Leu Leu
                165                 170                 175
Lys Leu Ile Asp Val Asn Thr Asn Asp Gly Pro Ala Lys Val Ile Cys
            180                 185                 190
Val Val Gly Met Gly Gly Leu Gly Lys Thr Thr Leu Ala Arg Lys Ala
        195                 200                 205
Tyr Glu Asn Lys Glu His Met Lys Asn Phe Ser Cys Cys Ala Trp Ile
    210                 215                 220
Thr Val Ser Gln Ser Phe Asp Arg Lys Glu Ile Leu Lys Gln Met Ile
225                 230                 235                 240
Arg Gln Leu Leu Gly Ala Asp Ser Leu Asp Lys Leu Leu Lys Glu Phe
                245                 250                 255
Ser Glu Lys Leu Leu Val Gln Val Gln His Leu Ala Asp His Leu Val
            260                 265                 270
Glu Gly Leu Lys Glu Lys Arg Tyr Phe Val Val Leu Asp Asp Leu Trp
        275                 280                 285
Thr Ile Asp Ala Trp Asn Trp Ile His Asp Ile Ala Phe Pro Lys Ile
    290                 295                 300
Asn Asn Arg Gly Ser Arg Ile Ile Ile Thr Thr Arg Asp Ala Gly Leu
305                 310                 315                 320
Ala Gly Arg Cys Thr Ser Glu Ser Leu Ile Tyr His Leu Glu Pro Leu
                325                 330                 335
His Ile Asp Asp Ala Ile His Leu Leu Leu Ala Lys Thr Asn Ile Arg
            340                 345                 350
Leu Glu Asp Met Glu Asn Asp Glu Asp Leu Gly Ser Ile Val Thr Lys
        355                 360                 365
Leu Val Lys Arg Cys Gly Tyr Leu Pro Leu Ala Ile Leu Thr Ile Gly
    370                 375                 380
Gly Ile Leu Ala Thr Lys Lys Ile Met Glu Trp Gly Lys Phe Tyr Arg
385                 390                 395                 400
Glu Leu Pro Ser Glu Leu Glu Ser Asn Pro Ser Leu Glu Ala Met Arg
                405                 410                 415
Arg Met Val Thr Leu Ser Tyr Asn His Leu Pro Ser His Leu Lys Pro
            420                 425                 430
Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Gln Arg
        435                 440                 445
Gly Arg Leu Val Asp Arg Trp Ile Ala Glu Gly Phe Val Arg Ala Thr
    450                 455                 460
Asp Gly Val Asn Ile Glu Asp Val Gly Asn Ser His Phe Asn Glu Leu
465                 470                 475                 480
Ile Asn Arg Ser Leu Ile Gln Pro Ser Lys Val Ser Thr Asp Gly Val
                485                 490                 495
Val Lys Arg Cys Arg Ile His Asp Ile Met Arg Asp Ile Ile Val Ser
            500                 505                 510
Ile Ser Arg Glu Glu Asn Phe Val Leu Leu Thr Arg Glu Lys Ile Thr
        515                 520                 525
Val Val Ala Glu Glu Ser Ile Arg His Leu Ala Phe His Gly Ser Lys
    530                 535                 540
Cys Ser Lys Ile Cys Leu Glu Trp Asn His Leu Arg Ser Val Thr Leu
545                 550                 555                 560
Phe Gly Asp Arg Pro Val Gly Arg Thr Pro Ala Leu Cys Ser Pro Gln
                565                 570                 575
Phe Arg Met Leu Arg Val Leu Asp Leu Glu Asp Ala Lys Phe Lys Phe
            580                 585                 590
Thr Gln Asn Asp Ile Arg Asn Ile Gly Leu Leu Arg His Met Lys Tyr
        595                 600                 605
Leu Asn Phe Ala Arg Ala Ser Thr Ile Tyr Thr Leu Pro Arg Ser Ile
    610                 615                 620
Gly Lys Leu Gln Cys Leu Gln Ile Leu Asn Met Arg Glu Ala Asn Ile
625                 630                 635                 640
Ser Ala Leu Thr Thr Glu Val Thr Lys Leu Gln Asn Leu Arg Ser Leu
                645                 650                 655
Arg Cys Ser Arg Arg Ser Gly Ser Gly Tyr Phe Ser Ile Ile Asp Asn
            660                 665                 670
Pro Lys Glu Cys Leu Met Ile Thr Met Cys Leu Pro Met Val Phe Leu
        675                 680                 685
Thr Ser Ile Asn Phe Ser Asp Arg Val Lys Leu Ile Pro Glu Ile Cys
    690                 695                 700
Met Ser Cys Ser Thr Arg Trp Ser Asp Thr Lys Gly Val Arg Val Pro
705                 710                 715                 720
Arg Gly Ile Asp Asn Leu Lys Glu Leu Gln Ile Leu Glu Val Val Asp
                725                 730                 735
Ile Asn Arg Thr Ser Arg Lys Ala Ile Glu Glu Leu Gly Glu Leu Ile
            740                 745                 750
Gln Leu Arg Lys Leu Ser Val Thr Thr Lys Gly Ala Thr Asn Lys Lys
        755                 760                 765
Tyr Gln Ile Phe Cys Ala Ala Ile Glu Lys Leu Ser Ser Leu Gln Ser
    770                 775                 780
Leu Arg Val Asp Ala Glu Gly Phe Ser Asp Thr Gly Thr Leu Glu Trp
785                 790                 795                 800
Leu Asn Ser Ile Ala Cys Pro Pro Pro Phe Leu Lys Arg Leu Lys Leu
                805                 810                 815
Asn Gly Ser Leu Ala Asp Thr Pro Asn Trp Phe Gly Asn Leu Lys Gln
            820                 825                 830
Leu Val Lys Met Cys Leu Ser Arg Cys Gly Leu Lys Asp Gly Lys Thr
        835                 840                 845
Met Glu Ile Leu Gly Ala Leu Pro Asn Leu Met Val Leu Arg Leu Tyr
    850                 855                 860
Arg Asn Ala Tyr Ala Asp Glu Lys Met Thr Phe Arg Arg Gly Thr Phe
865                 870                 875                 880
Pro Asn Leu Arg Cys Leu Asp Ile Tyr Leu Leu Lys Gln Leu Arg Glu
                885                 890                 895
Ile Arg Phe Glu Glu Gly Thr Ser Pro Thr Met Glu Ser Ile Glu Ile
            900                 905                 910
Tyr Gly Cys Arg Leu Glu Ser Gly Ile Ile Gly Ile Lys His Leu Pro
        915                 920                 925
Arg Leu Lys Ile Ile Ser Leu Glu Tyr Asp Gly Lys Val Ala Lys Leu
    930                 935                 940
Asp Val Leu Gln Glu Glu Val Asn Thr His Pro Asn His Thr Glu Leu
945                 950                 955                 960
Gln Met Ala Glu Asp Arg Ser His His Asp Leu Gly Gly Leu Ala Ser
                965                 970                 975
Asp Gly Asp Asp Ala His Asp Asn Pro Ala Leu Arg Tyr Gln Thr Ser
            980                 985                 990
Cys
<210>3
<211>3099
<212>DNA
<213>Oryza minuta
<220>
<221>CDS
<222>(1)...(3099)
<400>3
atg gcg gag acg gtg ctg agc atg gcg agg tcg ctg gtg ggc agt gcc    48
Met Ala Glu Thr Val Leu Ser Met Ala Arg Ser Leu Val Gly Ser Ala
 1               5                   10                  15
atc agc aag gcc gcc tct gcc gct gcc aat gag acg agc ctc ctg ctc    96
Ile Ser Lys Ala Ala Ser Ala Ala Ala Asn Glu Thr Ser Leu Leu Leu
             20                  25                  30
ggc gtc gag aag gac atc tgg tat atc aaa gat gag cta aaa aca atg    144
Gly Val Glu Lys Asp Ile Trp Tyr Ile Lys Asp Glu Leu Lys Thr Met
         35                  40                  45
cag gca ttc ctt aga gct gct gaa gtt atg aaa aag aaa gat gaa cta    192
Gln Ala Phe Leu Arg Ala Ala Glu Val Met Lys Lys Lys Asp Glu Leu
     50                  55                  60
tta aag gtt tgg gca gag caa ata cgt gac ctg tcg tat gac att gaa    240
Leu Lys Val Trp Ala Glu Gln Ile Arg Asp Leu Ser Tyr Asp Ile Glu
 65                  70                  75                  80
gat tcc ctt gat gaa ttt aaa gtc cat att gaa agc caa acc cta ttt    288
Asp Ser Leu Asp Glu Phe Lys Val His Ile Glu Ser Gln Thr Leu Phe
                 85                  90                  95
cgt cag ttg gtg aaa ctt aga gag cgc cac cgg atc gct atc cgt atc    336
Arg Gln Leu Val Lys Leu Arg Glu Arg His Arg Ile Ala Ile Arg Ile
            100                 105                 110
cac aac ctc aaa tca aga gtt gaa gaa gtg agt agc agg aac aca cgc    384
His Asn Leu Lys Ser Arg Val Glu Glu Val Ser Ser Arg Asn Thr Arg
        115                 120                 125
tac aat tta gtc gag cct att tcc tcc ggc aca gag gat gac atg gat    432
Tyr Asn Leu Val Glu Pro Ile Ser Ser Gly Thr Glu Asp Asp Met Asp
    130                 135                 140
tcc tat gca gaa gac att cgc aat caa tca gct cga aat gtg gat gaa    480
Ser Tyr Ala Glu Asp Ile Arg Asn Gln Ser Ala Arg Asn Val Asp Glu
145                 150                 155                 160
gct gag ctt gtt ggg ttt tct gac tcc aag aaa agg ctg ctt gaa atg    528
Ala Glu Leu Val Gly Phe Ser Asp Ser Lys Lys Arg Leu Leu Glu Met
                165                 170                 175
atc gat acc aat gct aat gat ggt ccg gcc aag gta atc tgt gtt gtt    576
Ile Asp Thr Asn Ala Asn Asp Gly Pro Ala Lys Val Ile Cys Val Val
            180                 185                 190
ggg atg ggt ggt tta ggc aag aca gct ctt tcg agg aag atc ttt gaa    624
Gly Met Gly Gly Leu Gly Lys Thr Ala Leu Ser Arg Lys Ile Phe Glu
        195                 200                 205
agc gaa gaa gac att agg aag aac ttc cct tgc aat gct tgg att aca    672
Ser Glu Glu Asp Ile Arg Lys Asn Phe Pro Cys Asn Ala Trp Ile Thr
    210                 215                 220
gtg tca caa tca ttt cac agg att gag cta ctt aaa gat atg ata cgc    720
Val Ser Gln Ser Phe His Arg Ile Glu Leu Leu Lys Asp Met Ile Arg
225                 230                 235                 240
caa ctt ctt ggt ccc agt tct ctg gat caa ctc ttg cat gaa ttg caa    768
Gln Leu Leu Gly Pro Ser Ser Leu Asp Gln Leu Leu His Glu Leu Gln
                245                 250                 255
ggg aag gtg gtg gtg caa gta cat cat ctt tct gag tac ctg ata gaa    816
Gly Lys Val Val Val Gln Val His His Leu Ser Glu Tyr Leu Ile Glu
            260                 265                 270
gag ctc aag gag aag agg tac ttt gtt gtt cta gat gat cta tgg att    864
Glu Leu Lys Glu Lys Arg Tyr Phe Val Val Leu Asp Asp Leu Trp Ile
        275                 280                 285
tta cat gat tgg aat tgg ata aat gaa att gca ttt cct aag aac aat    912
Leu His Asp Trp Asn Trp Ile Asn Glu Ile Ala Phe Pro Lys Asn Asn
    290                 295                 300
aag aag ggc agt cga ata gta ata acc act cgg aat gtt gat cta gcg    960
Lys Lys Gly Ser Arg Ile Val Ile Thr Thr Arg Asn Val Asp Leu Ala
305                 310                 315                 320
gag aag tgt gcc aca gcc tca ctg gtg tac cac ctt gat ttc ttg cag    1008
Glu Lys Cys Ala Thr Ala Ser Leu Val Tyr His Leu Asp Phe Leu Gln
                325                 330                 335
atg aac gat gcc att tca ttg cta ctg aga aaa aca aat aaa aat cat    1056
Met Asn Asp Ala Ile Ser Leu Leu Leu Arg Lys Thr Asn Lys Asn His
            340                 345                 350
gaa gac atg gaa tca aat aaa aat atg caa aag atg gtt gaa cga att    1104
Glu Asp Met Glu Ser Asn Lys Asn Met Gln Lys Met Val Glu Arg Ile
        355                 360                 365
gta aat aaa tgt ggt cgt cta cca tta gca ata ctt aca ata gga gct    1152
Val Asn Lys Cys Gly Arg Leu Pro Leu Ala Ile Leu Thr Ile Gly Ala
    370                 375                 380
gtg ctt gca act aaa cag gtg tca gaa tgg gag aaa ttc tat gaa caa    1200
Val Leu Ala Thr Lys Gln Val Ser Glu Trp Glu Lys Phe Tyr Glu Gln
385                 390                 395                 400
ctt cct tca gaa cta gaa ata aac cca agc ctg gaa gct ttg agg aga    1248
Leu Pro Ser Glu Leu Glu Ile Asn Pro Ser Leu Glu Ala Leu Arg Arg
                405                 410                 415
atg gtg acc cta ggt tac aac cac cta cca tcc cat ctg aaa cca tgc    1296
Met Val Thr Leu Gly Tyr Asn His Leu Pro Ser His Leu Lys Pro Cys
            420                 425                 430
ttt ttg tat cta agt atc ttt cct gag gat ttt gaa ata caa agg aat    1344
Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Gln Arg Asn
        435                 440                 445
cgt cta gta ggt aga tgg ata gca gaa ggg ttt gtt aga cca aag gtt    1392
Arg Leu Val Gly Arg Trp Ile Ala Glu Gly Phe Val Arg Pro Lys Val
    450                 455                 460
ggg atg acg act aag gat gtc gga gaa agt tac ttt aat gag cta atc    1440
Gly Met Thr Thr Lys Asp Val Gly Glu Ser Tyr Phe Asn Glu Leu Ile
465                 470                 475                 480
aac cga agt atg att caa cga tca aga gtg ggc aca gca gga aaa att    1488
Asn Arg Ser Met Ile Gln Arg Ser Arg Val Gly Thr Ala Gly Lys Ile
                485                 490                 495
aag act tgt cga atc cat gat atc atc cgt gat atc aca gtt tca atc    1536
Lys Thr Cys Arg Ile His Asp Ile Ile Arg Asp Ile Thr Val Ser Ile
            500                 505                 510
tcg aga cag gaa aat ttt gta tta tta cca atg gga gat ggc tct gat    1584
Ser Arg Gln Glu Asn Phe Val Leu Leu Pro Met Gly Asp Gly Ser Asp
        515                 520                 525
tta gtt cag gaa aac act cgc cac ata gca ttc cat ggg agt atg tcc    1632
Leu Val Gln Glu Asn Thr Arg His Ile Ala Phe His Gly Ser Met Ser
    530                 535                 540
tgc aaa aca gga ttg gat tgg agc att att cga tca tta gct att ttt    1680
Cys Lys Thr Gly Leu Asp Trp Ser Ile Ile Arg Ser Leu Ala Ile Phe
545                 550                 555                 560
ggt gac aga ccc aag agt cta gca cat gca gtt tgt cca gat caa ttg    1728
Gly Asp Arg Pro Lys Ser Leu Ala His Ala Val Cys Pro Asp Gln Leu
                565                 570                 575
agg atg tta cgg gtc ttg gat ctt gaa gat gtg aca ttc tta atc act    1776
Arg Met Leu Arg Val Leu Asp Leu Glu Asp Val Thr Phe Leu Ile Thr
            580                 585                 590
caa aaa gat ttc gac cgt att gca ttg ttg tgc cac ttg aaa tac ttg    1824
Gln Lys Asp Phe Asp Arg Ile Ala Leu Leu Cys His Leu Lys Tyr Leu
        595                 600                 605
agt att gga tat tcg tca tcc ata tat tca ctt ccc aga tcc att ggt    1872
Ser Ile Gly Tyr Ser Ser Ser Ile Tyr Ser Leu Pro Arg Ser Ile Gly
    610                 615                 620
aaa cta cag ggc cta cag act ttg aac atg tca agc aca tac att gca    1920
Lys Leu Gln Gly Leu Gln Thr Leu Asn Met Ser Ser Thr Tyr Ile Ala
625                 630                 635                 640
gca cta cca agt gag atc agt aaa ctc caa tgt ctg cat act ctt cgt    1968
Ala Leu Pro Ser Glu Ile Ser Lys Leu Gln Cys Leu His Thr Leu Arg
                645                 650                 655
tgt ata aga gag ctt gaa ttt gac aac ttt agt cta aat cac cca atg    2016
Cys Ile Arg Glu Leu Glu Phe Asp Asn Phe Ser Leu Asn His Pro Met
            660                 665                 670
aag tgc ata act aac aca ata tgc ctg cct aaa gta ttc aca cct tta    2064
Lys Cys Ile Thr Asn Thr Ile Cys Leu Pro Lys Val Phe Thr Pro Leu
        675                 680                 685
gtt agt cgc gat aat cgt gca aaa caa att gct gaa ttt cac atg gcc    2112
Val Ser Arg Asp Asn Arg Ala Lys Gln Ile Ala Glu Phe His Met Ala
    690                 695                 700
acc aaa agt ttc tgg tct gaa tca ttc ggt gtg aag gta ccc aaa gga    2160
Thr Lys Ser Phe Trp Ser Glu Ser Phe Gly Val Lys Val Pro Lys Gly
705                 710                 715                 720
ata ggt aag ttg cga gac tta cag gtt cta gag tat gta gat atc agg    2208
Ile Gly Lys Leu Arg Asp Leu Gln Val Leu Glu Tyr Val Asp Ile Arg
                725                 730                 735
cgg acc agt agt aga gca atc aaa gag ctg ggg cag tta agc aag ttg    2256
Arg Thr Ser Ser Arg Ala Ile Lys Glu Leu Gly Gln Leu Ser Lys Leu
            740                 745                 750
agg aaa tta gct gtg ata aca aaa ggc tcg aca aag gaa aaa tgt aag    2304
Arg Lys Leu Ala Val Ile Thr Lys Gly Ser Thr Lys Glu Lys Cys Lys
        755                 760                 765
ata ctt tat gca gcc att gag aag ctc tct tcc ctc caa tct ctc tat    2352
Ile Leu Tyr Ala Ala Ile Glu Lys Leu Ser Ser Leu Gln Ser Leu Tyr
    770                 775                 780
atg aat gct gcg tta tta tca gat att gaa aca ctt gag tgc cta gat    2400
Met Asn Ala Ala Leu Leu Ser Asp Ile Glu Thr Leu Glu Cys Leu Asp
785                 790                 795                 800
tct att tca tct cct cct ccc cta ctg agg aca ctc ggg ttg aat gga    2448
Ser Ile Ser Ser Pro Pro Pro Leu Leu Arg Thr Leu Gly Leu Asn Gly
                805                 810                 815
agt ctt gaa gag atg cct aac tgg att gag cag ctc act cac ctg aag    2496
Ser Leu Glu Glu Met Pro Asn Trp Ile Glu Gln Leu Thr His Leu Lys
            820                 825                 830
aag ttc aac tta tgg agt agt aaa cta aag gaa ggt aaa aac atg ctg    2544
Lys Phe Asn Leu Trp Ser Ser Lys Leu Lys Glu Gly Lys Asn Met Leu
        835                 840                 845
ata ctt ggg gca ctg ccc aac ctc atg ttc ctt tct ctt tat cat aat    2592
Ile Leu Gly Ala Leu Pro Asn Leu Met Phe Leu Ser Leu Tyr His Asn
    850                 855                 860
tct tat ctt ggg gag aag cta gta ttc aaa acg gga gca ttc cca aat    2640
Ser Tyr Leu Gly Glu Lys Leu Val Phe Lys Thr Gly Ala Phe Pro Asn
865                 870                 875                 880
ctt aga aca ctt gtg att ttc aat ttg gat cag cta aga gag atc aga    2688
Leu Arg Thr Leu Val Ile Phe Asn Leu Asp Gln Leu Arg Glu Ile Arg
                885                 890                 895
ttt gag gac ggc agc tca ccc cag ttg gaa aag ata gaa atc tct tgc    2736
Phe Glu Asp Gly Ser Ser Pro Gln Leu Glu Lys Ile Glu Ile Ser Cys
            900                 905                 910
tgc agg ttg gaa tca ggg att att ggt atc att cac ctt cca agg ctc    2784
Cys Arg Leu Glu Ser Gly Ile Ile Gly Ile Ile His Leu Pro Arg Leu
        915                 920                 925
aag gag att tca ctt gaa tac aaa agt aaa gtg gct agg ctt ggt cag    2832
Lys Glu Ile Ser Leu Glu Tyr Lys Ser Lys Val Ala Arg Leu Gly Gln
    930                 935                 940
ctg aag gga gaa gtg aac aca cac cca aat cgc ccc gtg ctg cga atg    2880
Leu Lys Gly Glu Val Asn Thr His Pro Asn Arg Pro Val Leu Arg Met
945                 950                 955                 960
gac agt gac cga agg gat cac gac ctg ggg gct gaa gcc gaa gga tct    2928
Asp Ser Asp Arg Arg Asp His Asp Leu Gly Ala Glu Ala Glu Gly Ser
                965                 970                 975
tct ata gaa gtg caa aca gca gat cct gtt cct gat gcc caa gga tca    2976
Ser Ile Glu Val Gln Thr Ala Asp Pro Val Pro Asp Ala Gln Gly Ser
            980                 985                 990
gtc act gta gca gtg gaa gca acg gat ccc ctt ccc gag cag gag gga    3024
Val Thr Val Ala Val Glu Ala Thr Asp Pro Leu Pro Glu Gln Glu Gly
         995                1000                1005
gag agc tcg cag tcg cag gtg atc acg ttg acg acg aat gat agc gaa    3072
Glu Ser Ser Gln Ser Gln Val Ile Thr Leu Thr Thr Asn Asp Ser Glu
    1010                1015                    1020
gag ata ggc aca gct caa gct ggc tga                                3099
Glu Ile Gly Thr Ala Gln Ala Gly  *
1025                1030
<210>4
<211>1032
<212>PRT
<213>Oryza minuta
<400>4
Met Ala Glu Thr Val Leu Ser Met Ala Arg Ser Leu Val Gly Ser Ala
 1               5                  10                  15
Ile Ser Lys Ala Ala Ser Ala Ala Ala Asn Glu Thr Ser Leu Leu Leu
            20                  25                  30
Gly Val Glu Lys Asp Ile Trp Tyr Ile Lys Asp Glu Leu Lys Thr Met
        35                  40                  45
Gln Ala Phe Leu Arg Ala Ala Glu Val Met Lys Lys Lys Asp Glu Leu
    50                  55                  60
Leu Lys Val Trp Ala Glu Gln Ile Arg Asp Leu Ser Tyr Asp Ile Glu
65                  70                  75                  80
Asp Ser Leu Asp Glu Phe Lys Val His Ile Glu Ser Gln Thr Leu Phe
                85                  90                  95
Arg Gln Leu Val Lys Leu Arg Glu Arg His Arg Ile Ala Ile Arg Ile
            100                 105                 110
His Asn Leu Lys Ser Arg Val Glu Glu Val Ser Ser Arg Asn Thr Arg
        115                 120                 125
Tyr Asn Leu Val Glu Pro Ile ger Ser Gly Thr Glu Asp Asp Met Asp
    130                 135                 140
Ser Tyr Ala Glu Asp Ile Arg Asn Gln Ser Ala Arg Asn Val Asp Glu
145                 150                 155                 160
Ala Glu Leu Val Gly Phe Ser Asp Ser Lys Lys Arg Leu Leu Glu Met
                165                 170                 175
Ile Asp Thr Asn Ala Asn Asp Gly Pro Ala Lys Val Ile Cys Val Val
            180                 185                 190
Gly Met Gly Gly Leu Gly Lys Thr Ala Leu Ser Arg Lys Ile Phe Glu
        195                 200                 205
Ser Glu Glu Asp Ile Arg Lys Asn Phe Pro Cys Asn Ala Trp Ile Thr
    210                 215                 220
Val Ser Gln Ser Phe His Arg Ile Glu Leu Leu Lys Asp Met Ile Arg
225                 230                 235                 240
Gln Leu Leu Gly Pro Ser Ser Leu Asp Gln Leu Leu His Glu Leu Gln
                245                 250                 255
Gly Lys Val Val Val Gln Val His His Leu Ser Glu Tyr Leu Ile Glu
            260                 265                 270
Glu Leu Lys Glu Lys Arg Tyr Phe Val Val Leu Asp Asp Leu Trp Ile
        275                 280                 285
Leu His Asp Trp Asn Trp Ile Asn Glu Ile Ala Phe Pro Lys Asn Asn
    290                 295                 300
Lys Lys Gly Ser Arg Ile Val Ile Thr Thr Arg Asn Val Asp Leu Ala
305                 310                 315                 320
Glu Lys Cys Ala Thr Ala Ser Leu Val Tyr His Leu Asp Phe Leu Gln
                325                 330                 335
Met Asn Asp Ala Ile Ser Leu Leu Leu Arg Lys Thr Asn Lys Asn His
            340                 345                 350
Glu Asp Met Glu Ser Asn Lys Asn Met Gln Lys Met Val Glu Arg Ile
        355                 360                 365
Val Asn Lys Cys Gly Arg Leu Pro Leu Ala Ile Leu Thr Ile Gly Ala
    370                 375                 380
Val Leu Ala Thr Lys Gln Val Ser Glu Trp Glu Lys Phe Tyr Glu Gln
385                 390                 395                 400
Leu Pro Ser Glu Leu Glu Ile Asn Pro Ser Leu Glu Ala Leu Arg Arg
                405                 410                 415
Met Val Thr Leu Gly Tyr Asn His Leu Pro Ser His Leu Lys Pro Cys
            420                 425                 430
Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Gln Arg Asn
        435                 440                 445
Arg Leu Val Gly Arg Trp Ile Ala Glu Gly Phe Val Arg Pro Lys Val
    450                 455                 460
Gly Met Thr Thr Lys Asp Val Gly Glu Ser Tyr Phe Asn Glu Leu Ile
465                 470                 475                 480
Asn Arg Ser Met Ile Gln Arg Ser Arg Val Gly Thr Ala Gly Lys Ile
                485                 490                 495
Lys Thr Cys Arg Ile His Asp Ile Ile Arg Asp Ile Thr Val Ser Ile
            500                 505                 510
Ser Arg Gln Glu Asn Phe Val Leu Leu Pro Met Gly Asp Gly Ser Asp
        515                 520                 525
Leu Val Gln Glu Asn Thr Arg His Ile Ala Phe His Gly Ser Met Ser
    530                 535                 540
Cys Lys Thr Gly Leu Asp Trp Ser Ile Ile Arg Ser Leu Ala Ile Phe
545                 550                 555                 560
Gly Asp Arg Pro Lys Ser Leu Ala His Ala Val Cys Pro Asp Gln Leu
                565                 570                 575
Arg Met Leu Arg Val Leu Asp Leu Glu Asp Val Thr Phe Leu Ile Thr
            580                 585                 590
Gln Lys Asp Phe Asp Arg Ile Ala Leu Leu Cys His Leu Lys Tyr Leu
        595                 600                 605
Ser Ile Gly Tyr Ser Ser Ser Ile Tyr Ser Leu Pro Arg Ser Ile Gly
    610                 615                 620
Lys Leu Gln Gly Leu Gln Thr Leu Asn Met Ser Ser Thr Tyr Ile Ala
625                 630                 635                 640
Ala Leu Pro Ser Glu Ile Ser Lys Leu Gln Cys Leu His Thr Leu Arg
                645                 650                 655
Cys Ile Arg Glu Leu Glu Phe Asp Asn Phe Ser Leu Asn His Pro Met
            660                 665                 670
Lys Cys Ile Thr Asn Thr Ile Cys Leu Pro Lys Val Phe Thr Pro Leu
        675                 680                 685
Val Ser Arg Asp Asn Arg Ala Lys Gln Ile Ala Glu Phe His Met Ala
    690                 695                 700
Thr Lys Ser Phe Trp Ser Glu Ser Phe Gly Val Lys Val Pro Lys Gly
705                 710                 715                 720
Ile Gly Lys Leu Arg Asp Leu Gln Val Leu Glu Tyr Val Asp Ile Arg
                725                 730                 735
Arg Thr Ser Ser Arg Ala Ile Lys Glu Leu Gly Gln Leu Ser Lys Leu
            740                 745                 750
Arg Lys Leu Ala Val Ile Thr Lys Gly Ser Thr Lys Glu Lys Cys Lys
        755                 760                 765
Ile Leu Tyr Ala Ala Ile Glu Lys Leu Ser Ser Leu Gln Ser Leu Tyr
    770                 775                 780
Met Asn Ala Ala Leu Leu Ser Asp Ile Glu Thr Leu Glu Cys Leu Asp
785                 790                 795                 800
Ser Ile Ser Ser Pro Pro Pro Leu Leu Arg Thr Leu Gly Leu Asn Gly
                805                 810                 815
Ser Leu Glu Glu Met Pro Asn Trp Ile Glu Gln Leu Thr His Leu Lys
            820                 825                 830
Lys Phe Asn Leu Trp Ser Ser Lys Leu Lys Glu Gly Lys Asn Met Leu
        835                 840                 845
Ile Leu Gly Ala Leu Pro Asn Leu Met Phe Leu Ser Leu Tyr His Asn
    850                 855                 860
Ser Tyr Leu Gly Glu Lys Leu Val Phe Lys Thr Gly Ala Phe Pro Asn
865                 870                 875                 880
Leu Arg Thr Leu Val Ile Phe Asn Leu Asp Gln Leu Arg Glu Ile Arg
                885                 890                 895
Phe Glu Asp Gly Ser Ser Pro Gln Leu Glu Lys Ile Glu Ile Ser Cys
            900                 905                 910
Cys Arg Leu Glu Ser Gly Ile Ile Gly Ile Ile His Leu Pro Arg Leu
        915                 920                 925
Lys Glu Ile Ser Leu Glu Tyr Lys Ser Lys Val Ala Arg Leu Gly Gln
    930                 935                 940
Leu Lys Gly Glu Val Asn Thr His Pro Asn Arg Pro Val Leu Arg Met
945                 950                 955                 960
Asp Ser Asp Arg Arg Asp His Asp Leu Gly Ala Glu Ala Glu Gly Ser
                965                 970                 975
Ser Ile Glu Val Gln Thr Ala Asp Pro Val Pro Asp Ala Gln Gly Ser
            980                 985                 990
Val Thr Val Ala Val Glu Ala Thr Asp Pro Leu Pro Glu Gln Glu Gly
        995                 1000                1005
Glu Ser Ser Gln Ser Gln Val Ile Thr Leu Thr Thr Asn Asp Ser Glu
    1010                1015                1020
Glu Ile Gly Thr Ala Gln Ala Gly
1025                1030
<210>5
<211>4147
<212>DNA
<213>Oryza minuta
<220>
<221>CDS
<222>(1)...(1983)
<400>5
atg gcg gat aca gta ctc agc att gca aag tcc ctg gtg gga agt gct    48
Met Ala Asp Thr Val Leu Ser Ile Ala Lys Ser Leu Val Gly Ser Ala
 1               5                   10                  15
gta agc aag gtt gct tcg gtt gcc gca gac aag atg atc atg ctg ctg    96
Val Ser Lys Val Ala Ser Val Ala Ala Asp Lys Met Ile Met Leu Leu
             20                  25                  30
gga gtg cag aag gag ata tgg ttc atc aaa gat gag cta caa acg ata    144
Gly Val Gln Lys Glu Ile Trp Phe Ile Lys Asp Glu Leu Gln Thr Ile
         35                  40                  45
caa gca ttt ttg att gct gcc gaa gca tca aag aaa agc ata cta ttg    192
Gln Ala Phe Leu Ile Ala Ala Glu Ala Ser Lys Lys Ser Ile Leu Leu
     50                  55                  60
aag gtt tgg gtg cag caa gta agg gat ctt tcc tat gac atc gaa gat    240
Lys Val Trp Val Gln Gln Val Arg Asp Leu Ser Tyr Asp Ile Glu Asp
 65                  70                  75                  80
tgc ctt gat gaa ttt aca gtt cat gtg ggc agc caa aac ttg tcg agg    288
Cys Leu Asp Glu Phe Thr Val His Val Gly Ser Gln Asn Leu Ser Arg
                 85                  90                  95
cag ttg atg aag cta aag gat cgc cat cgg att gcc atc cag atc cgc    336
Gln Leu Met Lys Leu Lys Asp Arg His Arg Ile Ala Ile Gln Ile Arg
            100                 105                 110
aat ctc agg aca aga att gaa gaa gta agc act agg aac ata cgc tac    384
Asn Leu Arg Thr Arg Ile Glu Glu Val Ser Thr Arg Asn Ile Arg Tyr
        115                 120                 125
aac tta ata gag aat gac ctc acc tgc acc act gat gag agg aat tta    432
Asn Leu Ile Glu Asn Asp Leu Thr Cys Thr Thr Asp Glu Arg Asn Leu
    130                 135                 140
ttt atg gaa gac att cgc aat caa tca gct aac aac atc gag gaa gct    480
Phe Met Glu Asp Ile Arg Asn Gln Ser Ala Asn Asn Ile Glu Glu Ala
145                 150                 155                 160
gat ctt gtg ggt ttt tct gga ccc aaa aga gag ttg ctt gat ctt ata    528
Asp Leu Val Gly Phe Ser Gly Pro Lys Arg Glu Leu Leu Asp Leu Ile
                165                 170                 175
gat gtc cat gcc aag gac gga cct aca aag gtt gta tgt gtt gtc ggt    576
Asp Val His Ala Lys Asp Gly Pro Thr Lys Val Val Cys Val Val Gly
            180                 185                 190
atg ggt ggt ttg ggt aag act act att gca agg aaa att tat gaa agc    624
Met Gly Gly Leu Gly Lys Thr Thr Ile Ala Arg Lys Ile Tyr Glu Ser
        195                 200                 205
aaa gag gac att gca aag aat ttt tct tgc tgt gct tgg att act gtt    672
Lys Glu Asp Ile Ala Lys Asn Phe Ser Cys Cys Ala Trp Ile Thr Val
    210                 215                 220
tca cag tcc ttt gtt agg gtg gaa cta ctc aag gat ttg atg gtg aaa    720
Ser Gln Ser Phe Val Arg Val Glu Leu Leu Lys Asp Leu Met Val Lys
225                 230                 235                 240
ctt ttt gga gag gaa gta ctg aag aag cgg ccg aga gaa ctc gaa ggg    768
Leu Phe Gly Glu Glu Val Leu Lys Lys Arg Pro Arg Glu Leu Glu Gly
                245                 250                 255
aag gtt cca caa gta gat gac ctt gcc agc tac ctc agg aca gag tta    816
Lys Val Pro Gln Val Asp Asp Leu Ala Ser Tyr Leu Arg Thr Glu Leu
            260                 265                 270
cat gaa agg agg tac ttt gtt gtg ctt gat gac gtg tgg agt aca gat    864
His Glu Arg Arg Tyr Phe Val Val Leu Asp Asp Val Trp Ser Thr Asp
        275                 280                 285
tca tgg aaa tgg att aat agt att gcc ttc cct aga aat aac aaa aaa    912
Ser Trp Lys Trp Ile Asn Ser Ile Ala Phe Pro Arg Asn Asn Lys Lys
    290                 295                 300
ggg agc cgg gtg ata gta aca aca aga gat gtt ggc tta gct aag aag    960
Gly Ser Arg Val Ile Val Thr Thr Arg Asp Val Gly Leu Ala Lys Lys
305                 310                 315                 320
tgt act tct gaa ttg ctt atc tac cag ctt aaa ccc cta gaa ata aac    1008
Cys Thr Ser Glu Leu Leu Ile Tyr Gln Leu Lys Pro Leu Glu Ile Asn
                325                 330                 335
tat gca aaa gag ttg ctt cta cgg aaa gca aat gaa gca ata gga gat    1056
Tyr Ala Lys Glu Leu Leu Leu Arg Lys Ala Asn Glu Ala Ile Gly Asp
            340                 345                 350
atg gaa agt gat aaa aag atg agt gac att ata act aaa ata gta aag    1104
Met Glu Ser Asp Lys Lys Met Ser Asp Ile Ile Thr Lys Ile Val Lys
        355                 360                 365
aag tgt ggg tat tta ccg ctg gct ata ctc aca ata gga ggc gtg ctt    1152
Lys Cys Gly Tyr Leu Pro Leu Ala Ile Leu Thr Ile Gly Gly Val Leu
    370                 375                 380
tcc acc aaa gag ata aga gag tgg gaa act ttt tat agt cag ata cct    1200
Ser Thr Lys Glu Ile Arg Glu Trp Glu Thr Phe Tyr Ser Gln Ile Pro
385                 390                 395                 400
tca gag ctt gag agc aac cca aac ctt gaa gca atg aga agg ata gtg    1248
Ser Glu Leu Glu Ser Asn Pro Asn Leu Glu Ala Met Arg Arg Ile Val
                405                 410                 415
acc cta agt tac aac tac tta ccg tct cat ctt aag caa tgc ttt ttg    1296
Thr Leu Ser Tyr Asn Tyr Leu Pro Ser His Leu Lys Gln Cys Phe Leu
            420                 425                 430
tat cta agc ata ttt cct gag gat ttt gaa att aat agg aac cgt ctg    1344
Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Asn Arg Asn Arg Leu
        435                 440                 445
gta aat aga tgg att gca gag ggg ttt att aaa gct agg act aat atg    1392
Val Asn Arg Trp Ile Ala Glu Gly Phe Ile Lys Ala Arg Thr Asn Met
    450                 455                 460
act att gaa gat gtt ggg aaa agt tac ttt aaa gaa ctt atc aac cgt    1440
Thr Ile Glu Asp Val Gly Lys Ser Tyr Phe Lys Glu Leu Ile Asn Arg
465                 470                 475                 480
agc atg att cag tca tca aga gcg ggt ata cga gga gat ttt aag agc    1488
Ser Met Ile Gln Ser Ser Arg Ala Gly Ile Arg Gly Asp Phe Lys Ser
                485                 490                 495
tgt cga gtc cat gac atc atg cgt gat att aca att tcg att tct aga    1536
Cys Arg Val His Asp Ile Met Arg Asp Ile Thr Ile Ser Ile Ser Arg
            500                 505                 510
gaa gaa aat ttc aca ctc tta ccc gat ggc act gac tat gat gta gta    1584
Glu Glu Asn Phe Thr Leu Leu Pro Asp Gly Thr Asp Tyr Asp Val Val
        515                 520                 525
cat ggg aac act cgg cac ata gca ttt cac ggg agt agg tat tgc tct    1632
His Gly Asn Thr Arg His Ile Ala Phe His Gly Ser Arg Tyr Cys Ser
    530                 535                 540
gaa aca agc ttg gac tgg agc att ata cgg tca tta act atg ttt ggt    1680
Glu Thr Ser Leu Asp Trp Ser Ile Ile Arg Ser Leu Thr Met Phe Gly
545                 550                 555                 560
gag agg tcc gta gaa cta gag cat tca gtt tgt tca tct cag ttg agg    1728
Glu Arg Ser Val Glu Leu Glu His Ser Val Cys Ser Ser Gln Leu Arg
                565                 570                 575
atg tta cgg gtc ttg gat cta ata gat gca caa ttt tct atc aca caa    1776
Met Leu Arg Val Leu Asp Leu Ile Asp Ala Gln Phe Ser Ile Thr Gln
            580                 585                 590
aat gat gtc gac aac ata gtg ctc ttg tgc cac ttg aaa tac cta cgc    1824
Asn Asp Val Asp Asn Ile Val Leu Leu Cys His Leu Lys Tyr Leu Arg
        595                 600                 605
att gca aga tac aga tac cgt tca cca tat att tat tca ctt cca caa    1872
Ile Ala Arg Tyr Arg Tyr Arg Ser Pro Tyr Ile Tyr Ser Leu Pro Gln
    610                 615                 620
tcc ata gct aga ctg cat ggt ctg cag aca ttg gac ttg ggt cag acg    1920
Ser Ile Ala Arg Leu His Gly Leu Gln Thr Leu Asp Leu Gly Gln Thr
625                 630                 635                 640
tac att tca aca ctg cca act cag att act aac ttc gga gtc tcc gta    1968
Tyr Ile Ser Thr Leu Pro Thr Gln Ile Thr Asn Phe Gly Val Ser Val
                645                 650                 655
gcc ttc gat gca tga aagaatattt ttcttcttct ttaagaacat atttaactaa    2023
Ala Phe Asp Ala  *
            660
cacattatgc ctgcccatga tattcacacc tttcgttagt acctcggatc gttctgaaac  2083
aattgctaaa ttgcacatgg ccaccaaagg cttccgttca aaatcaaatg gtgtcaaggt  2143
accaaaagga atatgtaagt tgagagactt acaagaggat tgctacggtc cagcaggttg  2203
taccgggcgg tactggtacc gcgcggtacc aaaacccatc taaccgttga atccgggatg  2263
ggtaggatcg ggagagaaaa gatgagcaag ggtggatgag ggagtacctg tttcgagtcg  2323
tcgttcccgg cggcggcggc gtggagtacc tgtttcgagt cgtcgtcgtt cccggtggcg  2383
gcgcagagca acaagggacg ccggcggcgc gggagaggat aaagtccggc ggcagcgcga  2443
gagagaaaaa agggaacggc gacggtgcgg gagaggaaca agggaaggac ggcggcggcg  2503
gaagaggaac aagtccgacg gcgaggaaga ggaacacggc ggcggcgaaa atcatccagc  2563
gtagctaggg ttcgagccgc ccgatccaaa cccatctatt gcacgcgaag ttactctttt  2623
acccttccaa ctctcttctc catgcggtat cacctaaggg acatttttgg taccgtgcgg  2683
taccacgcaa catcagccgt tggatcaggc cagatccaac ggccagcatt tggtaccgct  2743
cggtacgttg gacagtaaaa aaactcgact tacaaatatt ggaggtagtg gatattagaa 2803
ggactagcag tagagcaatc aaagagttgg ggcagttaag caagctgagg aaattatgtg 2863
tggtaacaaa gggatccaca aaggaaaaat gtgagatact ctatacagct atccagaagc 2923
tctgtttcct acaatctctc catgtgaatg ctgtgggatt ttcaggtatt ggaacacttc 2983
agtgtataga ttctatttca tctcctcctc ccctactgag gacactcagg ttgaatggaa 3043
gtcttgagga gatgcctaac tggattgagc agctcacgca cctgatgaag ttcaacttat 3103
ggaggagcaa actaaaagaa ggtaaaacca tgttggtact tgcggcgttg cccaacctca 3163
tggtccttta tcttcattcc aatgcttacc atggggagaa gctagtattc aaaatgggag 3223
cattcccaaa tcttagaaca ttttcgattt acaatttgga gcagctaaga gagattagat 3283
ttgaggacgg cagctcaatc ttgttggaaa agatagaaat attcaggggt tggaatcagg 3343
gattgttggt atcattcacc ttccaaggct caaggagatt tcacttggat acggaagtaa 3403
agtggctagg cttggtcagc tggagggaga agtgcgcaca cacccaaatc accccgtgat 3463
gcgaatgagg gaggaccgaa gtgatcacga ccttgcttgt gacgccgaag gatcccctgt 3523
tgaagtggaa gcaacagatc ctgtgagagc tcgcagttgc aggtgatcac gttgacaacg 3583
aacgacaggt cagtcactcc ctacacggca tcttaatgaa cttgttttat cctcttgtga 3643
gatcgatgat tttaactcac cctttcatct ctctcgtttt cttaacctaa cagcgaagag 3703
ataagcacaa cttaagctgg tttgatcaag tgatgatctc ctcctccatt ggcatctccg 3763
gtcgtccctg cttctgcggc tgcgcacctc gctgctctga ggaggggtgc tgatctaagg 3823
aggcttccac tttcttcaat tgcgtctcat gctctcgatt cttccctctc gggtatgaat 3883
tgttcaatct gatattttct cgcgatctgc tactggttcc agcatgagca tttgaaccag 3943
cagcttagaa ttatcgtttg atcaggtgtt atttatccct tcttacctgg gaactctact 4003
tatccatttc attcagaaca gaaaccatgt ttattacact atagagggga acaacagatc 4063
aggcacgagt tgtggttttg ttatttcctt tttggtgtgc acaccaggtg attgctagaa 4123
tgtctgaaag agcttgtgtg catg                                        4147
<210>6
<211>660
<212>PRT
<213>Oryza minuta
<400>6
Met Ala Asp Thr Val Leu Ser Ile Ala Lys Ser Leu Val Gly Ser Ala
 1               5                  10                  15
Val Ser Lys Val Ala Ser Val Ala Ala Asp Lys Met Ile Met Leu Leu
            20                  25                  30
Gly Val Gln Lys Glu Ile Trp Phe Ile Lys Asp Glu Leu Gln Thr Ile
        35                  40                  45
Gln Ala Phe Leu Ile Ala Ala Glu Ala Ser Lys Lys Ser Ile Leu Leu
    50                  55                  60
Lys Val Trp Val Gln Gln Val Arg Asp Leu Ser Tyr Asp Ile Glu Asp
65                  70                  75                  80
Cys Leu Asp Glu Phe Thr Val His Val Gly Ser Gln Asn Leu Ser Arg
                85                  90                  95
Gln Leu Met Lys Leu Lys Asp Arg His Arg Ile Ala Ile Gln Ile Arg
            100                 105                 110
Asn Leu Arg Thr Arg Ile Glu Glu Val Ser Thr Arg Asn Ile Arg Tyr
        115                 120                 125
Asn Leu Ile Glu Asn Asp Leu Thr Cys Thr Thr Asp Glu Arg Asn Leu
    130                 135                 140
Phe Met Glu Asp Ile Arg Asn Gln Ser Ala Asn Asn Ile Glu Glu Ala
145                 150                 155                 160
Asp Leu Val Gly Phe Ser Gly Pro Lys Arg Glu Leu Leu Asp Leu Ile
                165                 170                 175
Asp Val His Ala Lys Asp Gly Pro Thr Lys Val Val Cys Val Val Gly
            180                 185                 190
Met Gly Gly Leu Gly Lys Thr Thr Ile Ala Arg Lys Ile Tyr Glu Ser
        195                 200                 205
Lys Glu Asp Ile Ala Lys Asn Phe Ser Cys Cys Ala Trp Ile Thr Val
    210                 215                 220
Ser Gln Ser Phe Val Arg Val Glu Leu Leu Lys Asp Leu Met Val Lys
225                 230                 235                 240
Leu Phe Gly Glu Glu Val Leu Lys Lys Arg Pro Arg Glu Leu Glu Gly
                245                 250                 255
Lys Val Pro Gln Val Asp Asp Leu Ala Ser Tyr Leu Arg Thr Glu Leu
            260                 265                 270
His Glu Arg Arg Tyr Phe Val Val Leu Asp Asp Val Trp Ser Thr Asp
        275                 280                 285
Ser Trp Lys Trp Ile Asn Ser Ile Ala Phe Pro Arg Asn Asn Lys Lys
    290                 295                 300
Gly Ser Arg Val Ile Val Thr Thr Arg Asp Val Gly Leu Ala Lys Lys
305                 310                 315                 320
Cys Thr Ser Glu Leu Leu Ile Tyr Gln Leu Lys Pro Leu Glu Ile Asn
                325                 330                 335
Tyr Ala Lys Glu Leu Leu Leu Arg Lys Ala Asn Glu Ala Ile Gly Asp
            340                 345                 350
Met Glu Ser Asp Lys Lys Met Ser Asp Ile Ile Thr Lys Ile Val Lys
        355                 360                 365
Lys Cys Gly Tyr Leu Pro Leu Ala Ile Leu Thr Ile Gly Gly Val Leu
    370                 375                 380
Ser Thr Lys Glu Ile Arg Glu Trp Glu Thr Phe Tyr Ser Gln Ile Pro
385                 390                 395                 400
Ser Glu Leu Glu Ser Asn Pro Asn Leu Glu Ala Met Arg Arg Ile Val
                405                 410                 415
Thr Leu Ser Tyr Asn Tyr Leu Pro Ser His Leu Lys Gln Cys Phe Leu
            420                 425                 430
Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Asn Arg Asn Arg Leu
        435                 440                 445
Val Asn Arg Trp Ile Ala Glu Gly Phe Ile Lys Ala Arg Thr Asn Met
    450                 455                 460
Thr Ile Glu Asp Val Gly Lys Ser Tyr Phe Lys Glu Leu Ile Asn Arg
465                 470                 475                 480
Ser Met Ile Gln Ser Ser Arg Ala Gly Ile Arg Gly Asp Phe Lys Ser
                485                 490                 495
Cys Arg Val His Asp Ile Met Arg Asp Ile Thr Ile Ser Ile Ser Arg
            500                 505                 510
Glu Glu Asn Phe Thr Leu Leu Pro Asp Gly Thr Asp Tyr Asp Val Val
        515                 520                 525
His Gly Asn Thr Arg His Ile Ala Phe His Gly Ser Arg Tyr Cys Ser
    530                 535                 540
Glu Thr Ser Leu Asp Trp Ser Ile Ile Arg Ser Leu Thr Met Phe Gly
545                 550                 555                 560
Glu Arg Ser Val Glu Leu Glu His Ser Val Cys Ser Ser Gln Leu Arg
                565                 570                 575
Met Leu Arg Val Leu Asp Leu Ile Asp Ala Gln Phe Ser Ile Thr Gln
            580                 585                 590
Asn Asp Val Asp Asn Ile Val Leu Leu Cys His Leu Lys Tyr Leu Arg
        595                 600                 605
Ile Ala Arg Tyr Arg Tyr Arg Ser Pro Tyr Ile Tyr Ser Leu Pro Gln
    610                 615                 620
Ser Ile Ala Arg Leu His Gly Leu Gln Thr Leu Asp Leu Gly Gln Thr
625                 630                 635                 640
Tyr Ile Ser Thr Leu Pro Thr Gln Ile Thr Asn Phe Gly Val Ser Val
                645                 650                 655
Ala Phe Asp Ala
            660
<210>7
<211>3099
<212>DNA
<213>Oryza minuta
<220>
<221>CDS
<222>(1)...(3099)
<400>7
atg gcg gag acg gtg ctg agc atg gcg agg tcg ctg gtg ggc agc gcc    48
Met Ala Glu Thr Val Leu Ser Met Ala Arg Ser Leu Val Gly Ser Ala
 1               5                   10                  15
atc agc aag gcc gcc tcc gct gct gcc gac gag acc agc ctc ctg ctg    96
Ile Ser Lys Ala Ala Ser Ala Ala Ala Asp Glu Thr Ser Leu Leu Leu
             20                  25                  30
ggc gtc gag aaa gac atc tgg tat atc aaa gat gag cta aaa acg atg    144
Gly Val Glu Lys Asp Ile Trp Tyr Ile Lys Asp Glu Leu Lys Thr Met
         35                  40                  45
caa gca ttc ctt aga gct gct gaa ctt atg aaa aag aaa gat gaa cta    192
Gln Ala Phe Leu Arg Ala Ala Glu Leu Met Lys Lys Lys Asp Glu Leu
     50                  55                  60
tta aag gtt tgg gca gag caa ata cgt gac ctg tca tat gac att gaa    240
Leu Lys Val Trp Ala Glu Gln Ile Arg Asp Leu Ser Tyr Asp Ile Glu
 65                  70                  75                  80
gat tcc ctt gat gaa ttt aag gtc cat att gaa agc caa acc cta ttt    288
Asp Ser Leu Asp Glu Phe Lys Val His Ile Glu Ser Gln Thr Leu Phe
                 85                  90                  95
cgt cag ttg gtg aaa ctc aga gaa cgc cac cga att gct atc cgt atc    336
Arg Gln Leu Val Lys Leu Arg Glu Arg His Arg Ile Ala Ile Arg Ile
            100                 105                 110
cac aac ctt aaa tca aga gtt gaa gaa gtg agt agc agg aac aca cgc    384
His Asn Leu Lys Ser Arg Val Glu Glu Val Ser Ser Arg Asn Thr Arg
        115                 120                 125
tac agt tta gtc aag cct att tcc tct ggc aca gag att gac atg gat    432
Tyr Ser Leu Val Lys Pro Ile Ser Ser Gly Thr Glu Ile Asp Met Asp
    130                 135                 140
tcc tat gca gaa gac att cgt aat cag tca gct cgc aat gtg gat gag    480
Ser Tyr Ala Glu Asp Ile Arg Asn Gln Ser Ala Arg Asn Val Asp Glu
145                 150                 155                 160
gct gag ctt gtt ggg ttt tct gac tcc aag aaa agg ctg ctt gaa atg    528
Ala Glu Leu Val Gly Phe Ser Asp Ser Lys Lys Arg Leu Leu Glu Met
                165                 170                 175
atc gat acc aat gct aat gat ggt ccg gcc aag gta atc tgt gtt gtt    576
Ile Asp Thr Asn Ala Asn Asp Gly Pro Ala Lys Val Ile Cys Val Val
            180                 185                 190
ggg atg ggt ggt tta ggc aag aca gct ctt tcg agg aag atc ttt gaa    624
Gly Met Gly Gly Leu Gly Lys Thr Ala Leu Ser Arg Lys Ile Phe Glu
        195                 200                 205
agc gaa gaa gac att agg aag aac ttc cct tgc aat gct tgg att aca    672
Ser Glu Glu Asp Ile Arg Lys Asn Phe Pro Cys Asn Ala Trp Ile Thr
    210                 215                 220
gtg tca caa tca ttt cac agg att gag cta ctt aaa gat atg ata cgc    720
Val Ser Gln Ser Phe His Arg Ile Glu Leu Leu Lys Asp Met Ile Arg
225                 230                 235                 240
caa ctt ctt ggc ccc agt tct ctg gat caa ctc ttg caa gaa ttg caa    768
Gln Leu Leu Gly Pro Ser Ser Leu Asp Gln Leu Leu Gln Glu Leu Gln
                245                 250                 255
ggg aag gtg gtg gtg caa gta cat cat ctt tct gag tac ctg ata gaa    816
Gly Lys Val Val Val Gln Val His His Leu Ser Glu Tyr Leu Ile Glu
            260                 265                 270
gag ctc aag gag aag agg tac ttt gtt gtt cta gat gat cta tgg att    864
Glu Leu Lys Glu Lys Arg Tyr Phe Val Val Leu Asp Asp Leu Trp Ile
        275                 280                 285
tta cat gat tgg aat tgg ata aat gaa att gca ttt cct aag aac aat    912
Leu His Asp Trp Asn Trp Ile Asn Glu Ile Ala Phe Pro Lys Asn Asn
    290                 295                 300
aag aag ggc agt cga ata gta ata acc act cgg aat gtt gat ctt gcg    960
Lys Lys Gly Ser Arg Ile Val Ile Thr Thr Arg Asn Val Asp Leu Ala
305                 310                 315                 320
gag aag tgt gcc aca gcc tca ctg gtg tac cac ctt gat ttc ttg cag    1008
Glu Lys Cys Ala Thr Ala Ser Leu Val Tyr His Leu Asp Phe Leu Gln
                325                 330                 335
atg aac gat gcc ata aca ttg cta ctg aga aaa aca aat aaa aat cat    1056
Met Asn Asp Ala Ile Thr Leu Leu Leu Arg Lys Thr Asn Lys Asn His
            340                 345                 350
gaa gac atg gaa tca aat aaa aat atg caa aag atg gtt gaa cga att    1104
Glu Asp Met Glu Ser Asn Lys Asn Met Gln Lys Met Val Glu Arg Ile
        355                 360                 365
gta aat aaa tgt ggt cgt cta cca tta gca ata ctt aca ata gga gct    1152
Val Asn Lys Cys Gly Arg Leu Pro Leu Ala Ile Leu Thr Ile Gly Ala
    370                 375                 380
gtg ctt gca act aaa cag gtg tca gaa tgg gag aaa ttc tat gaa cac    1200
Val Leu Ala Thr Lys Gln Val Ser Glu Trp Glu Lys Phe Tyr Glu His
385                 390                 395                 400
ctt cct tca gaa cta gaa ata aac cca agc ctg gaa gct ttg agg aga    1248
Leu Pro Ser Glu Leu Glu Ile Asn Pro Ser Leu Glu Ala Leu Arg Arg
                405                 410                 415
atg gtg acc cta ggt tac aac cac cta cca tcc cat ttg aaa cca tgc    1296
Met Val Thr Leu Gly Tyr Asn His Leu Pro Ser His Leu Lys Pro Cys
            420                 425                 430
ttt ttg tat cta agt atc ttt cct gag gat ttt gaa atc aaa agg aat    1344
Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Lys Arg Asn
        435                 440                 445
cgt cta gta ggt aga tgg ata gca gaa ggg ttt gtt aga cca aag gtt    1392
Arg Leu Val Gly Arg Trp Ile Ala Glu Gly Phe Val Arg Pro Lys Val
    450                 455                 460
ggg atg acg act aag gat gtc gga gaa agt tac ttt aat gag cta atc    1440
Gly Met Thr Thr Lys Asp Val Gly Glu Ser Tyr Phe Asn Glu Leu Ile
465                 470                 475                 480
aac cga agt atg att caa cga tca aga gtg ggc ata gca gga aaa att    1488
Asn Arg Ser Met Ile Gln Arg Ser Arg Val Gly Ile Ala Gly Lys Ile
                485                 490                 495
aag act tgt cga att cat gat atc atc cgt gat atc aca gtt tca atc    1536
Lys Thr Cys Arg Ile His Asp Ile Ile Arg Asp Ile Thr Val Ser Ile
            500                 505                 510
tcg aga cag gaa aat ttt gta tta tta cca atg gga gat ggc tct gat    1584
Ser Arg Gln Glu Asn Phe Val Leu Leu Pro Met Gly Asp Gly Ser Asp
        515                 520                 525
tta gtt cag gaa aac act cgc cac ata gca ttc cat ggg agt atg tcc    1632
Leu Val Gln Glu Asn Thr Arg His Ile Ala Phe His Gly Ser Met Ser
    530                 535                 540
tgc aaa act gga ttg gat tgg agc att att cga tca tta gct att ttt    1680
Cys Lys Thr Gly Leu Asp Trp Ser Ile Ile Arg Ser Leu Ala Ile Phe
545                 550                 555                 560
ggt gac aga ccc aag agt cta gca cat gca gtt tgt cca gat caa ttg    1728
Gly Asp Arg Pro Lys Ser Leu Ala His Ala Val Cys Pro Asp Gln Leu
                565                 570                 575
agg atg tta cgg gtc ttg gat ctt gaa gat gtg aca ttc tta atc act    1776
Arg Met Leu Arg Val Leu Asp Leu Glu Asp Val Thr Phe Leu Ile Thr
            580                 585                 590
caa aaa gat ttc gac cgt att gca ttg ttg tgc cac ttg aaa tac ttg    1824
Gln Lys Asp Phe Asp Arg Ile Ala Leu Leu Cys His Leu Lys Tyr Leu
        595                 600                 605
agt att gga tat tcg tca tcc ata tat tca ctt ccc aga tcc att ggt    1872
Ser Ile Gly Tyr Ser Ser Ser Ile Tyr Ser Leu Pro Arg Ser Ile Gly
    610                 615                 620
aaa cta cag ggc cta caa act ttg aac atg ccg agc aca tac att gca    1920
Lys Leu Gln Gly Leu Gln Thr Leu Asn Met Pro Ser Thr Tyr Ile Ala
625                 630                 635                 640
gca cta cca agt gag atc agt aaa ctc caa tgt ctg cat act ctt cgt    1968
Ala Leu Pro Ser Glu Ile Ser Lys Leu Gln Cys Leu His Thr Leu Arg
                645                 650                 655
tgt ata gga cag ttt cat tat gac aac ttt agt cta aac cac cca atg    2016
Cys Ile Gly Gln Phe His Tyr Asp Asn Phe Ser Leu Asn His Pro Met
            660                 665                 670
aag tgc ata act aac aca ata tgc ctg cct aaa gta ttc aca cct tta    2064
Lys Cys Ile Thr Asn Thr Ile Cys Leu Pro Lys Val Phe Thr Pro Leu
        675                 680                 685
gtt agt cgc gat gat cgt gca aaa caa att gct gaa ttg cac atg gcc    2112
Val Ser Arg Asp Asp Arg Ala Lys Gln Ile Ala Glu Leu His Met Ala
    690                 695                 700
acc aaa agt tgc tgg tct gaa tca atc ggt gtg aag gta ccc aaa gga    2160
Thr Lys Ser Cys Trp Ser Glu Ser Ile Gly Val Lys Val Pro Lys Gly
705                 710                 715                 720
ata ggt aag ttg cga gac ttg cag gtt cta gag tat gta gat atc agg    2208
Ile Gly Lys Leu Arg Asp Leu Gln Val Leu Glu Tyr Val Asp Ile Arg
                725                 730                 735
cgg acc agt agt aga gca atc aaa gag ctg ggg cag tta agc aag ctg    2256
Arg Thr Ser Ser Arg Ala Ile Lys Glu Leu Gly Gln Leu Ser Lys Leu
            740                 745                 750
agg aaa tta ggt gtg aca aca aac ggg tcg aca aag gaa aaa tgt aag    2304
Arg Lys Leu Gly Val Thr Thr Asn Gly Ser Thr Lys Glu Lys Cys Lys
        755                 760                 765
ata ctt tat gca gcc att gag aag ctc tct tcc ctc caa tct ctc cat    2352
Ile Leu Tyr Ala Ala Ile Glu Lys Leu Ser Ser Leu Gln Ser Leu His
    770                 775                 780
gtg gat gct gca gga atc tca gat ggt gga aca ctt gag tgc cta gat    2400
Val Asp Ala Ala Gly Ile Ser Asp Gly Gly Thr Leu Glu Cys Leu Asp
785                 790                 795                 800
tct att tca tct cct cct ccc cta ctg agg aca ctc gtg ttg gat gga    2448
Ser Ile Ser Ser Pro Pro Pro Leu Leu Arg Thr Leu Val Leu Asp Gly
                805                 810                 815
att ctt gag gag atg cct aac tgg att gag cag ctc act cac ctg aag    2496
Ile Leu Glu Glu Met Pro Asn Trp Ile Glu Gln Leu Thr His Leu Lys
            820                 825                 830
aag atc tac tta ttg agg agc aaa cta aag gaa ggt aaa acc atg ctg    2544
Lys Ile Tyr Leu Leu Arg Ser Lys Leu Lys Glu Gly Lys Thr Met Leu
        835                 840                 845
ata ctt ggg gca ctg ccc aac ctc atg gtc ctt cat ctt tat cgg aat    2592
Ile Leu Gly Ala Leu Pro Asn Leu Met Val Leu His Leu Tyr Arg Asn
    850                 855                 860
gct tac ctt ggg gag aag cta gta ttc aaa aca gga gca ttc cca aat    2640
Ala Tyr Leu Gly Glu Lys Leu Val Phe Lys Thr Gly Ala Phe Pro Asn
865                 870                 875                 880
ctt aga aca ctt tgg att tat gaa ttg gat cag cta aga gag atc aga    2688
Leu Arg Thr Leu Trp Ile Tyr Glu Leu Asp Gln Leu Arg Glu Ile Arg
                885                 890                 895
ttt gag gac ggc agc tca ccc ctg ttg gaa aag ata gaa ata ggc gag    2736
Phe Glu Asp Gly Ser Ser Pro Leu Leu Glu Lys Ile Glu Ile Gly Glu
            900                 905                 910
tgc agg ttg gaa tct ggg att act ggt atc att cac ctt cca aag ctc    2784
Cys Arg Leu Glu Ser Gly Ile Thr Gly Ile Ile His Leu Pro Lys Leu
        915                 920                 925
aag gag att cca att aga tac gga agt aaa gtg gct ggg ctt ggt cag    2832
Lys Glu Ile Pro Ile Arg Tyr Gly Ser Lys Val Ala Gly Leu Gly Gln
    930                 935                 940
ctg gag gga gaa gtg aac gca cac cca aat cgc ccc gtg ctg cta atg    2880
Leu Glu Gly Glu Val Asn Ala His Pro Asn Arg Pro Val Leu Leu Met
945                 950                 955                 960
tac agt gac cga agg tat cac gac ctg ggg gct gaa gcc gaa gga tct    2928
Tyr Ser Asp Arg Arg Tyr His Asp Leu Gly Ala Glu Ala Glu Gly Ser
                965                 970                 975
tct ata gaa gtg caa aca gca gat cct gtt cct gat gcc gaa gga tca    2976
Ser Ile Glu Val Gln Thr Ala Asp Pro Val Pro Asp Ala Glu Gly Ser
            980                 985                 990
gtc act gta gca gtg gaa gca acg gat ccc ctt ccc gag cag gag gga    3024
Val Thr Val Ala Val Glu Ala Thr Asp Pro Leu Pro Glu Gln Glu Gly
        995                 1000                1005
gag agc tcg cag tcg cag gtg atc acg ttg acg acg aat gat agc gaa    3072
Glu Ser Ser Gln Ser Gln Val Ile Thr Leu Thr Thr Asn Asp Ser Glu
    1010                1015                1020
gag ata ggc aca gct caa gct ggc tga                                3099
Glu Ile Gly Thr Ala Gln Ala Gly  *
1025                1030
<210>8
<211>1032
<212>PRT
<213>Oryza minuta
<400>8
Met Ala Glu Thr Val Leu Ser Met Ala Arg Ser Leu Val Gly Ser Ala
 1               5                  10                  15
Ile Ser Lys Ala Ala Ser Ala Ala Ala Asp Glu Thr Ser Leu Leu Leu
            20                  25                  30
Gly Val Glu Lys Asp Ile Trp Tyr Ile Lys Asp Glu Leu Lys Thr Met
        35                  40                  45
Gln Ala Phe Leu Arg Ala Ala Glu Leu Met Lys Lys Lys Asp Glu Leu
    50                  55                  60
Leu Lys Val Trp Ala Glu Gln Ile Arg Asp Leu Ser Tyr Asp Ile Glu
65                  70                  75                  80
Asp Ser Leu Asp Glu Phe Lys Val His Ile Glu Ser Gln Thr Leu Phe
                85                  90                 95
Arg Gln Leu Val Lys Leu Arg Glu Arg His Arg Ile Ala Ile Arg Ile
            100                 105                 110
His Asn Leu Lys Ser Arg Val Glu Glu Val Ser Ser Arg Asn Thr Arg
        115                 120                 125
Tyr Ser Leu Val Lys Pro Ile Ser Ser Gly Thr Glu Ile Asp Met Asp
    130                 135                 140
Ser Tyr Ala Glu Asp Ile Arg Asn Gln Ser Ala Arg Asn Val Asp Glu
145                 150                 155                 160
Ala Glu Leu Val Gly Phe Ser Asp Ser Lys Lys Arg Leu Leu Glu Met
                165                 170                 175
Ile Asp Thr Asn Ala Asn Asp Gly Pro Ala Lys Val Ile Cys Val Val
            180                 185                 190
Gly Met Gly Gly Leu Gly Lys Thr Ala Leu Ser Arg Lys Ile Phe Glu
        195                 200                 205
Ser Glu Glu Asp Ile Arg Lys Asn Phe Pro Cys Asn Ala Trp Ile Thr
    210                 215                 220
Val Ser Gln Ser Phe His Arg Ile Glu Leu Leu Lys Asp Met Ile Arg
225                 230                 235                 240
Gln Leu Leu Gly Pro Ser Ser Leu Asp Gln Leu Leu Gln Glu Leu Gln
                245                 250                 255
Gly Lys Val Val Val Gln Val His His Leu Ser Glu Tyr Leu Ile Glu
            260                 265                 270
Glu Leu Lys Glu Lys Arg Tyr Phe Val Val Leu Asp Asp Leu Trp Ile
        275                 280                 285
Leu His Asp Trp Asn Trp Ile Asn Glu Ile Ala Phe Pro Lys Asn Asn
    290                 295                 300
Lys Lys Gly Ser Arg Ile Val Ile Thr Thr Arg Asn Val Asp Leu Ala
305                 310                 315                 320
Glu Lys Cys Ala Thr Ala Ser Leu Val Tyr His Leu Asp Phe Leu Gln
                325                 330                 335
Met Asn Asp Ala Ile Thr Leu Leu Leu Arg Lys Thr Asn Lys Asn His
            340                 345                 350
Glu Asp Met Glu Ser Asn Lys Asn Met Gln Lys Met Val Glu Arg Ile
        355                 360                 365
Val Asn Lys Cys Gly Arg Leu Pro Leu Ala Ile Leu Thr Ile Gly Ala
    370                 375                 380
Val Leu Ala Thr Lys Gln Val Ser Glu Trp Glu Lys Phe Tyr Glu His
385                 390                 395                 400
Leu Pro Ser Glu Leu Glu Ile Asn Pro Ser Leu Glu Ala Leu Arg Arg
                405                 410                 415
Met Val Thr Leu Gly Tyr Asn His Leu Pro Ser His Leu Lys Pro Cys
            420                 425                 430
Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe Glu Ile Lys Arg Asn
        435                 440                 445
Arg Leu Val Gly Arg Trp Ile Ala Glu Gly Phe Val Arg Pro Lys Val
    450                 455                 460
Gly Met Thr Thr Lys Asp Val Gly Glu Ser Tyr Phe Asn Glu Leu Ile
465                 470                 475                 480
Asn Arg Ser Met Ile Gln Arg Ser Arg Val Gly Ile Ala Gly Lys Ile
                485                 490                 495
Lys Thr Cys Arg Ile His Asp Ile Ile Arg Asp Ile Thr Val Ser Ile
            500                 505                 510
Ser Arg Gln Glu Asn Phe Val Leu Leu Pro Met Gly Asp Gly Ser Asp
        515                 520                 525
Leu Val Gln Glu Asn Thr Arg His Ile Ala Phe His Gly Ser Met Ser
    530                 535                 540
Cys Lys Thr Gly Leu Asp Trp Ser Ile Ile Arg Ser Leu Ala Ile Phe
545                 550                 555                 560
Gly Asp Arg Pro Lys Ser Leu Ala His Ala Val Cys Pro Asp Gln Leu
                565                 570                 575
Arg Met Leu Arg Val Leu Asp Leu Glu Asp Val Thr Phe Leu Ile Thr
            580                 585                 590
Gln Lys Asp Phe Asp Arg Ile Ala Leu Leu Cys His Leu Lys Tyr Leu
        595                 600                 605
Ser Ile Gly Tyr Ser Ser Ser Ile Tyr Ser Leu Pro Arg Ser Ile Gly
    610                 615                 620
Lys Leu Gln Gly Leu Gln Thr Leu Asn Met Pro Ser Thr Tyr Ile Ala
625                 630                 635                 640
Ala Leu Pro Ser Glu Ile Ser Lys Leu Gln Cys Leu His Thr Leu Arg
                645                 650                 655
Cys Ile Gly Gln Phe His Tyr Asp Asn Phe Ser Leu Asn His Pro Met
            660                 665                 670
Lys Cys Ile Thr Asn Thr Ile Cys Leu Pro Lys Val Phe Thr Pro Leu
        675                 680                 685
Val Ser Arg Asp Asp Arg Ala Lys Gln Ile Ala Glu Leu His Met Ala
    690                 695                 700
Thr Lys Ser Cys Trp Ser Glu Ser Ile Gly Val Lys Val Pro Lys Gly
705                 710                 715                 720
Ile Gly Lys Leu Arg Asp Leu Gln Val Leu Glu Tyr Val Asp Ile Arg
                725                 730                 735
Arg Thr Ser Ser Arg Ala Ile Lys Glu Leu Gly Gln Leu Ser Lys Leu
            740                 745                 750
Arg Lys Leu Gly Val Thr Thr Asn Gly Ser Thr Lys Glu Lys Cys Lys
        755                 760                 765
Ile Leu Tyr Ala Ala Ile Glu Lys Leu Ser Ser Leu Gln Ser Leu His
    770                 775                 780
Val Asp Ala Ala Gly Ile Ser Asp Gly Gly Thr Leu Glu Cys Leu Asp
785                 790                 795                 800
Ser Ile Ser Ser Pro Pro Pro Leu Leu Arg Thr Leu Val Leu Asp Gly
                805                 810                 815
Ile Leu Glu Glu Met Pro Asn Trp Ile Glu Gln Leu Thr His Leu Lys
            820                 825                 830
Lys Ile Tyr Leu Leu Arg Ser Lys Leu Lys Glu Gly Lys Thr Met Leu
        835                 840                 845
Ile Leu Gly Ala Leu Pro Asn Leu Met Val Leu His Leu Tyr Arg Asn
    850                 855                 860
Ala Tyr Leu Gly Glu Lys Leu Val Phe Lys Thr Gly Ala Phe Pro Asn
865                 870                 875                 880
Leu Arg Thr Leu Trp Ile Tyr Glu Leu Asp Gln Leu Arg Glu Ile Arg
                885                 890                 895
Phe Glu Asp Gly Ser Ser Pro Leu Leu Glu Lys Ile Glu Ile Gly Glu
            900                 905                 910
Cys Arg Leu Glu Ser Gly Ile Thr Gly Ile Ile His Leu Pro Lys Leu
        915                 920                 925
Lys Glu Ile Pro Ile Arg Tyr Gly Ser Lys Val Ala Gly Leu Gly Gln
    930                 935                 940
Leu Glu Gly Glu Val Asn Ala His Pro Asn Arg Pro Val Leu Leu Met
945                 950                 955                 960
Tyr Ser Asp Arg Arg Tyr His Asp Leu Gly Ala Glu Ala Glu Gly Ser
                965                 970                 975
Ser Ile Glu Val Gln Thr Ala Asp Pro Val Pro Asp Ala Glu Gly Ser
            980                 985                 990
Val Thr Val Ala Val Glu Ala Thr Asp Pro Leu Pro Glu Gln Glu Gly
        995                 1000                1005
Glu Ser Ser Gln Ser Gln Val Ile Thr Leu Thr Thr Asn Asp Ser Glu
    1010                1015                1020
Glu Ile Gly Thr Ala Gln Ala Gly
1025                1030
<210>9
<211>1389
<212>DNA
<213>Oryza minuta
<220>
<221>CDS
<222>(322)...(471)
<400>9
ggaaaagata gaactctctt ggtgaaggtt ggaatcaggg attattggta tcattcacct 60
tccaaagctc aaggaaattt cacttgaata cagaagtaaa gtagctaggc ttggtcagct 120
ggagggagaa gtgggcgcac atccaaagca tccagtgctg caaatgatgg aggatcgaag 180
ctatcgcgac ctaggaggtg atgccgaagt atctgctgta caagtgcaag caggatcccc 240
tccctgagca agagggagag agcacgcagg aaaaatattc gccatgtagc gtaccatgac 300
agcaagtgtt ctattatagg c atg gac tgg agc cat gta cgg tcg tta act   351
                        Met Asp Trp Ser His Val Arg Ser Leu Thr
                         1               5                  10
ttg ttt ggc gat gag aga ccc aaa gag ctc tca cct cca ttc tgt tct   399
Leu Phe Gly Asp Glu Arg Pro Lys Glu Leu Ser Pro Pro Phe Cys Ser
                 15                  20                  25
ccc caa ttg aaa atg cta agg gtg ctg gat cta cta gat att ata ttt   447
Pro Gln Leu Lys Met Leu Arg Val Leu Asp Leu Leu Asp Ile Ile Phe
             30                  35                  40
gga cta gca aaa aga tat gga taa aatatggttg ttgcgtcact tgaaatatgt  501
Gly Leu Ala Lys Arg Tyr Gly  *
         45
caatattagg tgttccaatg aatgctcaag catttatgca cttcctagtt ccataagaaa 561
attacaagag ttacacactg gacatatctg acacttatat tacaatgcta ccaaatgaga 621
ttagtaaatt gcagtctatg tgtcctccgt ggtagaagac aaggatccta ctatgacctt 681
gatacatata atcgtaagga atgtgtactt attttatcac gtattccttt gattatggct 741
ttaagtgatt ctgataacca tagaagacta attaccgatc tacacacggg ttgttcaagt 801
cattggcata taattaaaga tggtgcaagg gtaccaagtg gaatcaagaa tttgaagaga 861
ttgaaagtac tagagatagt ggatatcgcg gtaactgaca gcagagcaat tcaagagttg 921
ggggaactta accagctaag aaaactaagt gtcatgacaa aagggtcgaa caagaaaaag 981
tgcaaaatac tttgtgcagc catcgaaaag ctcacttcct tcaaatctct ctatgtggat 1041
ggtcatggat actcacttga tggaacactt gagtggcttg attctatttc ccatcctcct 1101
tccctcaaga gccttagatt gaaggggtgt attaaggaga cacccaactg gtttagggag 1161
ctcaaacact tggtgaagat ttacttatat aaaagtcgcc taaatggaga taccatggag 1221
atactcgggg aactacataa tctcatggat cttcactttc gttggtatgc atacgttggg 1281
gagaagctag tgttcattga gggagcattc caaaatctcc ggaagcttgt tgttgaaact 1341
gaggataaac taagagaggt gaggtttgag gagggcacct caccccag              1389
<210>10
<211>49
<212>PRT
<213>Oryza minuta
<400>10
Met Asp Trp Ser His Val Arg Ser Leu Thr Leu Phe Gly Asp Glu Arg
 1               5                  10                  15
Pro Lys Glu Leu Ser Pro Pro Phe Cys Ser Pro Gln Leu Lys Met Leu
            20                  25                  30
Arg Val Leu Asp Leu Leu Asp Ile Ile Phe Gly Leu Ala Lys Arg Tyr
        35                  40                  45
Gly
<210>11
<211>2997
<212>DNA
<213>Oryza minuta
<220>
<221>CDS
<222>(1)...(2997)
<400>11
atg gcg gag acg gtg ctg agc atg gcg agg tcg ctg gtg ggg agc gcc    48
Met Ala Glu Thr Val Leu Ser Met Ala Arg Ser Leu Val Gly Ser Ala
 1               5                   10                  15
atc agc aag gcc gcc tcc gcc gct gcc gac gag acc agc ctc ctg ctc    96
Ile Ser Lys Ala Ala Ser Ala Ala Ala Asp Glu Thr Ser Leu Leu Leu
             20                  25                  30
ggc gtc gag aaa gac atc tgg tac ttg ttt aga cat ggt gtt gga cgg    144
Gly Val Glu Lys Asp Ile Trp Tyr Leu Phe Arg His Gly Val Gly Arg
         35                  40                  45
tcg aat ggt ggg cct gtt gta ggt atg gtg gca tct ggc aac cag tca    192
Ser Asn Gly Gly Pro Val Val Gly Met Val Ala Ser Gly Asn Gln Ser
     50                  55                  60
tgc tta gca ata gat tcc tat gca gaa gac att cgc aat caa tca gct    240
Cys Leu Ala Ile Asp Ser Tyr Ala Glu Asp Ile Arg Asn Gln Ser Ala
 65                  70                  75                  80
cga aat gtg gat gaa gct gag ctt gtt ggg ttt tct gac tcc aag aaa    288
Arg Asn Val Asp Glu Ala Glu Leu Val Gly Phe Ser Asp Ser Lys Lys
                 85                  90                  95
agg ctg ctt gaa atg atc gat acc aat gct aat gat ggt ccg gcc aag    336
Arg Leu Leu Glu Met Ile Asp Thr Asn Ala Asn Asp Gly Pro Ala Lys
            100                 105                 110
gta atc tgt gtt gtt ggg atg ggt ggt tta ggc aag aca gct ctt tcg    384
Val Ile Cys Val Val Gly Met Gly Gly Leu Gly Lys Thr Ala Leu Ser
        115                 120                 125
agg aag atc ttt gaa agc gaa gaa gac att agg aag aac ttc cct tgc    432
Arg Lys Ile Phe Glu Ser Glu Glu Asp Ile Arg Lys Asn Phe Pro Cys
    130                 135                 140
aat gct tgg att aca gtg tca caa tca ttt cac agg att gag cta ctt    480
Asn Ala Trp Ile Thr Val Ser Gln Ser Phe His Arg Ile Glu Leu Leu
145                 150                 155                 160
aaa gat atg ata cgc caa ctt ctt ggc ccc agt tct ctg gat caa ctc    528
Lys Asp Met Ile Arg Gln Leu Leu Gly Pro Ser Ser Leu Asp Gln Leu
                165                 170                 175
ttg caa gaa ttg caa ggg aag gtg gtg gtg caa gta cat cat ctt tct    576
Leu Gln Glu Leu Gln Gly Lys Val Val Val Gln Val His His Leu Ser
            180                 185                 190
gag tac ctg ata gaa gag ctc aag gag aag agg tac ttt gtt gtt cta    624
Glu Tyr Leu Ile Glu Glu Leu Lys Glu Lys Arg Tyr Phe Val Val Leu
        195                 200                 205
gat gat cta tgg att tta cat gat tgg aat tgg ata aat gaa att gca    672
Asp Asp Leu Trp Ile Leu His Asp Trp Asn Trp Ile Asn Glu Ile Ala
    210                 215                 220
ttt cct aag aac aat aag aag ggc agt caa ata gta ata acc act tgg    720
Phe Pro Lys Asn Asn Lys Lys Gly Ser Gln Ile Val Ile Thr Thr Trp
225                 230                 235                 240
aat gtt gat ctt gcg gag aag tgt gcc aca gcc tca ctg gtg tac cac    768
Asn Val Asp Leu Ala Glu Lys Cys Ala Thr Ala Ser Leu Val Tyr His
                245                 250                 255
ctt gat ttc ttg cag atg aac gat gcc ata aca ttg cta ctg aga aaa    816
Leu Asp Phe Leu Gln Met Asn Asp Ala Ile Thr Leu Leu Leu Arg Lys
            260                 265                 270
aca aat aaa aat cat gaa gac atg gaa tca aat aaa aat atg caa aag    864
Thr Asn Lys Asn His Glu Asp Met Glu Ser Asn Lys Asn Met Gln Lys
        275                 280                 285
atg gtt gaa cga att gta aat aaa tgt ggt cgt cta cca tta gca ata    912
Met Val Glu Arg Ile Val Asn Lys Cys Gly Arg Leu Pro Leu Ala Ile
    290                 295                 300
ctt aca ata gga gct gtg ctt gca act aaa cag gtg tca gaa tgg gag    960
Leu Thr Ile Gly Ala Val Leu Ala Thr Lys Gln Val Ser Glu Trp Glu
305                 310                 315                 320
aaa ttc tat gaa cac ctt cct tca gaa cta gaa ata aac cca agc ctg    1008
Lys Phe Tyr Glu His Leu Pro Ser Glu Leu Glu Ile Asn Pro Ser Leu
                325                 330                 335
gaa gct ttg agg aga atg gtg acc cta ggt tac aac cac cta cca tcc    1056
Glu Ala Leu Arg Arg Met Val Thr Leu Gly Tyr Asn His Leu Pro Ser
            340                 345                 350
cat ctg aaa cca tgc ttt ttg tat cta agt atc ttt cct gag gat ttt    1104
His Leu Lys Pro Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe
        355                 360                 365
gaa atc aaa agg aat cgt cta gta ggt aga tgg ata gca gaa ggg ttt    1152
Glu Ile Lys Arg Asn Arg Leu Val Gly Arg Trp Ile Ala Glu Gly Phe
    370                 375                 380
gtt aga cca aag gtt ggg atg acg act aag gat gtc gga gaa agt tac    1200
Val Arg Pro Lys Val Gly Met Thr Thr Lys Asp Val Gly Glu Ser Tyr
385                 390                 395                 400
ttt aat gag cta atc aac cga agt atg att caa cga tca aga gtg ggc    1248
Phe Asn Glu Leu Ile Asn Arg Ser Met Ile Gln Arg Ser Arg Val Gly
                405                 410                 415
ata gca gga aaa att aag act tgt cga att cat gat atc atc cgt gat    1296
Ile Ala Gly Lys Ile Lys Thr cys Arg Ile His Asp Ile Ile Arg Asp
            420                 425                 430
atc aca gtt tca atc tcg aga cag gaa aat ttt gta ttg tta cca atg    1344
Ile Thr Val Ser Ile Ser Arg Gln Glu Asn Phe Val Leu Leu Pro Met
        435                 440                 445
gga gat ggc tct gat tta gtt cag gaa aac act cgc cac ata gca ttc    1392
Gly Asp Gly Ser Asp Leu Val Gln Glu Asn Thr Arg His Ile Ala Phe
    450                 455                 460
cat ggg agt atg tcc tgc aaa aca gga ttg gat tgg agc att att cga    1440
His Gly Ser Met Ser Cys Lys Thr Gly Leu Asp Trp Ser Ile Ile Arg
465                 470                 475                 480
tca tta gct att ttt ggt gac aga ccc aag agt cta gca cat gca gtt    1488
Ser Leu Ala Ile Phe Gly Asp Arg Pro Lys Ser Leu Ala His Ala Val
                485                 490                 495
tgt cca gat caa ttg agg atg tta cgg gtc ttg gat ctt gaa gat gtg    1536
Cys Pro Asp Gln Leu Arg Met Leu Arg Val Leu Asp Leu Glu Asp Val
            500                 505                 510
aca ttc tta atc act caa aaa gat ttc gac cgt att gca ttg ttg tgc    1584
Thr Phe Leu Ile Thr Gln Lys Asp Phe Asp Arg Ile Ala Leu Leu Cys
        515                 520                 525
cac ttg aaa tac ttg agt att gga tat tcg tca tcc ata tat tca ctt    1632
His Leu Lys Tyr Leu Ser Ile Gly Tyr Ser Ser Ser Ile Tyr Ser Leu
    530                 535                 540
ccc aga tcc att ggt aaa cta cag ggc cta caa act ttg aac atg ccg    1680
Pro Arg Ser Ile Gly Lys Leu Gln Gly Leu Gln Thr Leu Asn Met Pro
545                 550                 555                 560
agc aca tac att gca gca cta cca agt gag atc agt aaa ctc caa tgt    1728
Ser Thr Tyr Ile Ala Ala Leu Pro Ser Glu Ile Ser Lys Leu Gln Cys
                565                 570                 575
ctg cat act ctt cgt tgt agt aga aag ttt gtt tct gac aac ttt agt    1776
Leu His Thr Leu Arg Cys Ser Arg Lys Phe Val Ser Asp Asn Phe Ser
            580                 585                 590
cta aac cac cca atg aag tgc ata act aac aca ata tgc ctg cct aaa    1824
Leu Asn His Pro Met Lys Cys Ile Thr Asn Thr Ile Cys Leu Pro Lys
        595                 600                 605
gta ttc aca cct tta gtt agt cgc gat gat cgt gca ata caa att gct    1872
Val Phe Thr Pro Leu Val Ser Arg Asp Asp Arg Ala Ile Gln Ile Ala
    610                 615                 620
gaa ttg cac atg gcc acc aaa agt tgc tgg tat aaa tca ttc ggt gtg    1920
Glu Leu His Met Ala Thr Lys Ser Cys Trp Tyr Lys Ser Phe Gly Val
625                 630                 635                 640
aag gta ccc aaa gga ata ggt aag ttg cga gac tta cag gtt cta gag    1968
Lys Val Pro Lys Gly Ile Gly Lys Leu Arg Asp Leu Gln Val Leu Glu
                645                 650                 655
tat gta gat atc agg cgg acc agt agt aga gca atc aaa gag ctg ggg    2016
Tyr Val Asp Ile Arg Arg Thr Ser Ser Arg Ala Ile Lys Glu Leu Gly
            660                 665                 670
cag tta agc aag ctg agg aaa tta ggt gtg atg aca aat ggc tcg aca    2064
Gln Leu Ser Lys Leu Arg Lys Leu Gly Val Met Thr Asn Gly Ser Thr
        675                 680                 685
aag gaa aaa tgt aag ata ctt tgt gca gcc att gag aag ctc tct tcc    2112
Lys Glu Lys Cys Lys Ile Leu Cys Ala Ala Ile Glu LysLeu Ser Ser
    690                 695                 700
ctc caa tat ctc tat gtg aat gct gca gga atc tca gat ggt gga aca    2160
Leu Gln Tyr Leu Tyr Val Asn Ala Ala Gly Ile Ser Asp Gly Gly Thr
705                 710                 715                 720
ctt gag tgc cta gat tct att tcc tct cct cct ccc cta ctg agg aca    2208
Leu Glu Cys Leu Asp Ser Ile Ser Ser Pro Pro Pro Leu Leu Arg Thr
                725                 730                 735
ctc gtg ttg tat gga agt ctt gaa gag atg cct aac tgg att gag cag    2256
Leu Val Leu Tyr Gly Ser Leu Glu Glu Met Pro Asn Trp Ile Glu Gln
            740                 745                 750
ctc act cac ctg aag aag atc tac tta ttg agg agc aaa cta aag gaa    2304
Leu Thr His Leu Lys Lys Ile Tyr Leu Leu Arg Ser Lys Leu Lys Glu
        755                 760                 765
ggt aaa acc atg ctg ata ctt ggg gca ttg ccc aac ctc atg gtc ctt    2352
Gly Lys Thr Met Leu Ile Leu Gly Ala Leu Pro Asn Leu Met Val Leu
    770                 775                 780
gat ctt tat cgg aaa gct tac ctt ggg gag aag cta gta ttc aaa aca    2400
Asp Leu Tyr Arg Lys Ala Tyr Leu Gly Glu Lys Leu Val Phe Lys Thr
785                 790                 795                 800
gga gca ttc cca aat ctt aga aca ctt tcg att tac gat ttg gat cag    2448
Gly Ala Phe Pro Asn Leu Arg Thr Leu Ser Ile Tyr Asp Leu Asp Gln
                805                 810                 815
cta aga gag att aga ttt gag gac ggc agc tcg ccc cag ttg gaa aag    2496
Leu Arg Glu Ile Arg Phe Glu Asp Gly Ser Ser Pro Gln Leu Glu Lys
            820                 825                 830
ata gaa atc aga ttc tgc agg ttg gaa tca ggg att att ggt att atc    2544
Ile Glu Ile Arg Phe Cys Arg Leu Glu Ser Gly Ile Ile Gly Ile Ile
        835                 840                 845
cac ctt cca agg ctc aag gag att tca ctt gga tac gaa agt aaa gtg    2592
His Leu Pro Arg Leu Lys Glu Ile Ser Leu Gly Tyr Glu Ser Lys Val
    850                 855                 860
gct ggg ctt gct cag ctg gag gga gaa gtg cgc aca cac cca aat cac    2640
Ala Gly Leu Ala Gln Leu Glu Gly Glu Val Arg Thr His Pro Asn His
865                 870                 875                 880
ccc gtg ctg cga aag agg gag gac cga agt gat cac gac ctt gct tgt    2688
Pro Val Leu Arg Lys Arg Glu Asp Arg Ser Asp His Asp Leu Ala Cys
                885                 890                 895
gac gcc gaa gga tcc cct gtt gaa gtg gaa gca acg gat ccc ctc cca    2736
Asp Ala Glu Gly Ser Pro Val Glu Val Glu Ala Thr Asp Pro Leu Pro
            900                 905                 910
gag cag gag gga gag agc tcg cag cga aga gat aag cac agc tca agc    2784
Glu Gln Glu Gly Glu Ser Ser Gln Arg Arg Asp Lys His Ser Ser Ser
        915                 920                 925
tgg ttt tat caa gtg atg atc tcc tcc tcc att ggc atc tcc ggt cgt    2832
Trp Phe Tyr Gln Val Met Ile Ser Ser Ser Ile Gly Ile Ser Gly Arg
    930                 935                 940
ccc tgc ttc tgc ggc tgc gca cac ctc gct gtt ccg agg agg ggt gct    2880
Pro Cys Phe Cys Gly Cys Ala His Leu Ala Val Pro Arg Arg Gly Ala
945                 950                 955                 960
gat cta agg agg ctt cca ctt tct tca att gcg tct cac gct ctc gat    2928
Asp Leu Arg Arg Leu Pro Leu Ser Ser Ile Ala Ser His Ala Leu Asp
                965                 970                 975
tct tcc ctc tcg ggt atg aat tgt ttc aat ctg acc ttt tct cgt gat    2976
Ser Ser Leu Ser Gly Met Asn Cys Phe Asn Leu Thr Phe Ser Arg Asp
            980                 985                 990
atg cta ctg gtt cca gca tga                                        2997
Met Leu Leu Val Pro Ala  *
        995
<210>12
<211>998
<212>PRT
<213>Oryza minuta
<400>12
Met Ala Glu Thr Val Leu Ser Met Ala Arg Ser Leu Val Gly Ser Ala
 1               5                  10                  15
Ile Ser Lys Ala Ala Ser Ala Ala Ala Asp Glu Thr Ser Leu Leu Leu
            20                  25                  30
Gly Val Glu Lys Asp Ile Trp Tyr Leu Phe Arg His Gly Val Gly Arg
        35                  40                  45
Ser Asn Gly Gly Pro Val Val Gly Met Val Ala Ser Gly Asn Gln Ser
    50                  55                  60
Cys Leu Ala Ile Asp Ser Tyr Ala Glu Asp Ile Arg Asn Gln Ser Ala
65                  70                  75                  80
Arg Asn Val Asp Glu Ala Glu Leu Val Gly Phe Ser Asp Ser Lys Lys
                85                  90                  95
Arg Leu Leu Glu Met Ile Asp Thr Asn Ala Asn Asp Gly Pro Ala Lys
            100                 105                 110
Val Ile Cys Val Val Gly Met Gly Gly Leu Gly Lys Thr Ala Leu Ser
        115                 120                 125
Arg Lys Ile Phe Glu Ser Glu Glu Asp Ile Arg Lys Asn Phe Pro Cys
    130                 135                 140
Asn Ala Trp Ile Thr Val Ser Gln Ser Phe His Arg Ile Glu Leu Leu
145                 150                 155                 160
Lys Asp Met Ile Arg Gln Leu Leu Gly Pro Ser Ser Leu Asp Gln Leu
                165                 170                 175
Leu Gln Glu Leu Gln Gly Lys Val Val Val Gln Val His His Leu Ser
            180                 185                 190
Glu Tyr Leu Ile Glu Glu Leu Lys Glu Lys Arg Tyr Phe Val Val Leu
        195                 200                 205
Asp Asp Leu Trp Ile Leu His Asp Trp Asn Trp Ile Asn Glu Ile Ala
    210                 215                 220
Phe Pro Lys Asn Asn Lys Lys Gly Ser Gln Ile Val Ile Thr Thr Trp
225                 230                 235                 240
Asn Val Asp Leu Ala Glu Lys Cys Ala Thr Ala Ser Leu Val Tyr His
                245                 250                 255
Leu Asp Phe Leu Gln Met Asn Asp Ala Ile Thr Leu Leu Leu Arg Lys
            260                 265                 270
Thr Asn Lys Asn His Glu Asp Met Glu Ser Asn Lys Asn Met Gln Lys
        275                 280                 285
Met Val Glu Arg Ile Val Asn Lys Cys Gly Arg Leu Pro Leu Ala Ile
    290                 295                 300
Leu Thr Ile Gly Ala Val Leu Ala Thr Lys Gln Val Ser Glu Trp Glu
305                 310                 315                 320
Lys Phe Tyr Glu His Leu Pro Ser Glu Leu Glu Ile Asn Pro Ser Leu
                325                 330                 335
Glu Ala Leu Arg Arg Met Val Thr Leu Gly Tyr Asn His Leu Pro Ser
            340                 345                 350
His Leu Lys Pro Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Phe
        355                 360                 365
Glu Ile Lys Arg Asn Arg Leu Val Gly Arg Trp Ile Ala Glu Gly Phe
    370                 375                 380
Val Arg Pro Lys Val Gly Met Thr Thr Lys Asp Val Gly Glu Ser Tyr
385                 390                 395                 400
Phe Asn Glu Leu Ile Asn Arg Ser Met Ile Gln Arg Ser Arg Val Gly
                405                 410                 415
Ile Ala Gly Lys Ile Lys Thr Cys Arg Ile His Asp Ile Ile Arg Asp
            420                 425                 430
Ile Thr Val Ser Ile Ser Arg Gln Glu Asn Phe Val Leu Leu Pro Met
        435                 440                 445
Gly Asp Gly Ser Asp Leu Val Gln Glu Asn Thr Arg His Ile Ala Phe
    450                 455                 460
His Gly Ser Met Ser Cys Lys Thr Gly Leu Asp Trp Ser Ile Ile Arg
465                 470                 475                 480
Ser Leu Ala Ile Phe Gly Asp Arg Pro Lys Ser Leu Ala His Ala Val
                485                 490                 495
Cys Pro Asp Gln Leu Arg Met Leu Arg Val Leu Asp Leu Glu Asp Val
            500                 505                 510
Thr Phe Leu Ile Thr Gln Lys Asp Phe Asp Arg Ile Ala Leu Leu Cys
        515                 520                 525
His Leu Lys Tyr Leu Ser Ile Gly Tyr Ser Ser Ser Ile Tyr Ser Leu
    530                 535                 540
Pro Arg Ser Ile Gly Lys Leu Gln Gly Leu Gln Thr Leu Asn Met Pro
545                 550                 555                 560
Ser Thr Tyr Ile Ala Ala Leu Pro Ser Glu Ile Ser Lys Leu Gln Cys
                565                 570                 575
Leu His Thr Leu Arg Cys Ser Arg Lys Phe Val Ser Asp Asn Phe Ser
            580                 585                 590
Leu Asn His Pro Met Lys Cys Ile Thr Asn Thr Ile Cys Leu Pro Lys
        595                 600                 605
Val Phe Thr Pro Leu Val Ser Arg Asp Asp Arg Ala Ile Gln Ile Ala
    610                 615                 620
Glu Leu His Met Ala Thr Lys Ser Cys Trp Tyr Lys Ser Phe Gly Val
625                 630                 635                 640
Lys Val Pro Lys Gly Ile Gly Lys Leu Arg Asp Leu Gln Val Leu Glu
                645                 650                 655
Tyr Val Asp Ile Arg Arg Thr Ser Ser Arg Ala Ile Lys Glu Leu Gly
            660                 665                 670
Gln Leu Ser Lys Leu Arg Lys Leu Gly Val Met Thr Asn Gly Ser Thr
        675                 680                 685
Lys Glu Lys Cys Lys Ile Leu Cys Ala Ala Ile Glu Lys Leu Ser Ser
    690                 695                 700
Leu Gln Tyr Leu Tyr Val Asn Ala Ala Gly Ile Ser Asp Gly Gly Thr
705                 710                 715                 720
Leu Glu Cys Leu Asp Ser Ile Ser Ser Pro Pro Pro Leu Leu Arg Thr
                725                 730                 735
Leu Val Leu Tyr Gly Ser Leu Glu Glu Met Pro Asn Trp Ile Glu Gln
            740                 745                 750
Leu Thr His Leu Lys Lys Ile Tyr Leu Leu Arg Ser Lys Leu Lys Glu
        755                 760                 765
Gly Lys Thr Met Leu Ile Leu Gly Ala Leu Pro Asn Leu Met Val Leu
    770                 775                 780
Asp Leu Tyr Arg Lys Ala Tyr Leu Gly Glu Lys Leu Val Phe Lys Thr
785                 790                 795                 800
Gly Ala Phe Pro Asn Leu Arg Thr Leu Ser Ile Tyr Asp Leu Asp Gln
                805                 810                 815
Leu Arg Glu Ile Arg Phe Glu Asp Gly Ser Ser Pro Gln Leu Glu Lys
            820                 825                 830
Ile Glu Ile Arg Phe Cys Arg Leu Glu Ser Gly Ile Ile Gly Ile Ile
        835                 840                 845
His Leu Pro Arg Leu Lys Glu Ile Ser Leu Gly Tyr Glu Ser Lys Val
    850                 855                 860
Ala Gly Leu Ala Gln Leu Glu Gly Glu Val Arg Thr His Pro Asn His
865                 870                 875                 880
Pro Val Leu Arg Lys Arg Glu Asp Arg Ser Asp His Asp Leu Ala Cys
                885                 890                 895
Asp Ala Glu Gly Ser Pro Val Glu Val Glu Ala Thr Asp Pro Leu Pro
            900                 905                 910
Glu Gln Glu Gly Glu Ser Ser Gln Arg Arg Asp Lys His Ser Ser Ser
        915                 920                 925
Trp Phe Tyr Gln Val Met Ile Ser Ser Ser Ile Gly Ile Ser Gly Arg
    930                 935                 940
Pro Cys Phe Cys Gly Cys Ala His Leu Ala Val Pro Arg Arg Gly Ala
945                 950                 955                 960
Asp Leu Arg Arg Leu Pro Leu Ser Ser Ile Ala Ser His Ala Leu Asp
                965                 970                 975
Ser Ser Leu Ser Gly Met Asn Cys Phe Asn Leu Thr Phe Ser Arg Asp
            980                 985                 990
Met Leu Leu Val Pro Ala
        995
<210>13
<211>99090
<212>DNA
<213>Oryza minuta
<220>
<221>misc_feature
<222>23216
<223>n=A,T,C or G
<400>13
aagcttggct ttctcttcat gaacaagctg tcgattggtt tggattgtag cctcgatgtc 60
cttgcattcc cggagatcgg ctaacctctg cctggctttc tccagtttga attgatgctg 120
ctcgaggtag acagctggag taagagcatc gactaattcg tccggaagag aggcttggat 180
atctgcaaat cttgcccgga tcgagccaca gttggtcacc aggttatcta gtgatgctcc 240
tagccgatgg gatatgtctt cgagtgtttt cttcacatca tcagacagga gagctgttgc 300
tttactggtg gtgtcttctt ctatttcatc gaggtaatct ttgatgtcaa aggagaatag 360
atcggctaag acctgcaaga gacaatatca tggatgatta aggatcaaga tatgattggc 420
cgatctcaag tttatgttaa taaaacttac tggaatagta ggtgcagcta attgttcctc 480
ctcttcaaca tgatgactac ctgcagccga tggagtgcgg ccgcctgatt ctacctgcat 540
aagaggggaa gaaggaggag gaggctgcca aagggataaa tgttagatat aatcagccca 600
agtcagttaa tgagatgata gaagtatctt actggtggag ctagtttagg ggttggagta 660
accgatttct tcctcacggc aattttcttt ctctatattt attaaaattg tgaggaattg 720
gctataaagt aaatgactgc aaaagtggac agagaaagtt gcttaccctt gccaattgag 780
ctggagcaga agggaatgga ggagcctgct taggtgaagc cgatggtgtt ttttcagtat 840
cgcttatttc ggctgcagct tggtcgatgt cttcctcgat ttcttcttca tccagagctt 900
gttcgatgga tggatctagg gcaggtagat cgtcagctgg cttagctttc tgtcttagcc 960
ttcttcttcg gagccggggc tgaagtatct gcagccgatg atctggttct ccgcttcttg 1020
ccggcatcgg ctggttctct gatgagtcct cggagaagtg ctgaggtctt tggggcattg 1080
tagccgatgg cagaaggaga tggcccacct ccattgggaa tcaagcttgg ggcatattca 1140
atttctttac cactattact ccggcgagga ggagaagatt ctgttgtctg cagatcagaa 1200
gaaaaggtta atcaaggttt aaatcggctg ttggttattt aagtaagagt gataaagtga 1260
agacttacct gaggaatggt atcagggaat aggtccgtca tatacatgga ggccaattgg 1320
tggaacaggt gcagtttcca ttcaccccac tatctgtcaa atgccctact cctgaacctt 1380
gccagcttta tgttctcgat gctgcccaac ggaggtccgg ggatgttcaa cagccgatcc 1440
atcattaaag ttgaggagat gtcgcttctg cattggatct tgtcggcaaa gtacaggcca 1500
attggcaatt gtcccattcc aaattgtttg gccaatgaca tcggatgata aaactcgtag 1560
gagacttgga tatttctccc ttgatggatg ccgactggga ggatacatgg gctgatagca 1620
gtagtaaaga tttctctgga ttgctgaaac ttttcatgat taatatcctc gaacctgaaa 1680
tcggctggca gttcgaaatc cattgagtcg gcatagaaga accaaactca ggcatttttt 1740
tggactccgt cataaaagct gaagaacaag tccttcagaa gttcaaccga taattttgtt 1800
cctgcatcag ctggtgtaga tgcatactct ccgtatgaca tacatctgcg atgggtgcgt 1860
tcttctccat catcttctac aatcggctcc aaccttggaa attcagcttc tgtcacatat 1920
ggccgattga caactttcat tactaccagg ttcagccaag attgcaagag ccaccatggt 1980
ccacctgttc taaccactga gccgataatt atcttggccg atgcgttgtt taacatctgg 2040
tatagatagc cgagaaggat tttgcctaag ggaaattgtt tcttcgttac tagggcctcg 2100
gctaagaatt gccagttggt tgtaggaccg cagcttgatc cgcataaaag gaattttacc 2160
aaccacatca gcagaaaagc tacttgttct ttaggagtga ctggcccttt gcccatatat 2220
gctgtgatat atcctgacca acccccaatg ctcttagttt tgaactcaaa agtgttcttg 2280
gtgtttaggc tcatggggtt agccgatgag gttacatcta ggccagtgag catgataata 2340
tccagcagcg ttggggtcat cagcccttga ttgaaaagaa aggcattgag agtgttggac 2400
cagaaataag ttgcagccgc caacaggggt tcatctttgg ccgaatttgc tactgtaagg 2460
gctagggctt ggctgattcc gatctcatcc caatgggctt gcttgctatc cgatatccgc 2520
ttataccata caggccagct tttctccaga gaaggccagg atttgaaggt gtttttccaa 2580
tggcttgtgt ttggattggc cgacctaaaa ggagttctat tggtttaggc tatgataaat 2640
tcagtagggt ctagattgcc gattggaccg agaaagtatt gttggtcatg caacagactg 2700
ggaaccacaa caagattgga aagatgctac aagaatagag aaggagaaaa cgggataagg 2760
cgagcgaaaa ccggtctaat gaacggaaaa gggatctagc cgatggggac ttaccttagc 2820
gtattcggct gatgatgcgg cggtcggact ggtggaggtc gacatcgtcg cgggtggaga 2880
tctggccggg agtggaatcg tctggaaatc gccctgcgcg tcgaggaggt cgccggagaa 2940
agaagacggg atctgcttga gcggtgaaaa cggagaccat ggcgtgaaga ttctctgggg 3000
cgacgattag tatttaaagc agagcgataa cggtcgggaa aatggcaagt gcgagtttct 3060
ctcggagtcg gtatatggca aatccgaaac attatccaat attccggact tggggggcat 3120
gtgttaacga ccaaatttgg taaattctat cactattagc atcggagatg aaaatcagat 3180
cgaagtggaa tccaagatga agatcgttgc ggagacagag taaaaatcgg ctgcagtcta 3240
aatcggctaa ggtcaggatc ggcagagtcc gagttggacg gggctagccg atacaaccga 3300
ttccgataat atgacccggt gaacgtcatt gggtgattcc gatgagcttc aaggtgattg 3360
ccatgcttgg atagagtcct gggaaggcga ttgtatctat taattaggat attctatgta 3420
atttccttag agatatgttt gggcaaaagt ctgccgtaaa gacttatggt atcttagagt 3480
ttgttagaga taatagtcgt gtccgttatg gacgtatctt gtaatcctcg ggtataaata 3540
gacccgagcc ctatgtaaaa aaaaaggaca acacatccaa tacaatctcg gcgcatcgcc 3600
acccttttgc tttactttta tttcgacgag ttcgtgctct cgggttgagc tgcatcggtt 3660
tcgatcttca acaagaggta aaacttgtca tgacgactta tgttcttagg atttgtgctt 3720
ccatctttat gacactctaa tcttgtctat ataattcgtc gagttatcat atatctcaca 3780
tagtcttcga taatatcttt atctaaccta taatcggcta acatctgcta atggaaggca 3840
gctgattagg ttagataatg acattaactt agattatgtg atatatctac cactctatga 3900
aactttcagc ggcttgattg tctagatatt gttcttcttt tcatacttaa tgctgcatca 3960
gttgagtttg atctattaag tcgtgcttag aattgcaatc tctagcctgc tttctggttg 4020
ccgattaggg tagtatcgga gtttcagccg atcttatctg atttaactac ttttattcta 4080
tatgcttgat tgacacgtta aatccaccct ttatgttagg attttattgc atctaagtat 4140
attaagctta tgtttggtat attctacttg ctttaatatc ttagtataga gtggtatcgg 4200
agtattagcc gatacatgct agatctacct gatcagctat gttttgaatg tatataaccc 4260
tactattaat atatatttcg atctaagtga tttatactgt ctcggcaagg caaccgatct 4320
atcccaatca cttgatttaa gtatataccg atataaggat tatatatcat taatgtgtac 4380
agttgatcga gtagatttag ttctgaattg cttgttgata tttgccgatc gatgtacgca 4440
tgacatcggc ttgaaataaa tgatatgtca tcggcatcta gccgatcggc tatcatttat 4500
gggattaatt gcggtttctt tgttctatct cttgttgatt gcaggatcaa atcaactggc 4560
acgctcatac atccgaaggc gagttttgga cctgcactgg agttaagcag atctcccagg 4620
cctcgtgttt tctgtcaaca taattatata agaaatctta ccaaaatttt agcaagttaa 4680
taaaattttg gcaactatgc taaaattttg gcaatgccaa attttggtaa ggtttttttt 4740
agcatcaaag tgaacaggcc ctggataagg gaatacgtac ttttatcttt gctgattcat 4800
ccaccgcagt gtccgtcttc ttgtactgtt tacgtattgt ttgaatccgt cttcgtgaca 4860
cacaaccttc cccttcaccg ttcgcgagat gatggcctcg cggtcgcggc tccgcctcgc 4920
cgccgccggc gagaacccta tcccacactc caagtccggc ggggagggag gaacggagag 4980
gaagccggag gaggcgctgc ggcgggaggt gacggacctg ggcggcggca gcgaggtggt 5040
gcacgtgccg cggttcgtgc cccgggaggc ggcgtggggg tggttcgact acctcgacaa 5100
gcgcatccca tggacacgcc ccaccatccg cgtattcggc cgctccgccg tccaggtaca 5160
gagaggtcac cgccgccgcc cgcgcctctc attgaaccct tcattttaat ctttgtgggg 5220
cttccctaat cggtcgcaat ttttgctctg ttgttcattt gataaatttc tactagtgct 5280
aagatttcgc tataggttgg tgcattatcg ttgattcttg gaggaaaaac catagtacta 5340
tcttgcttgg tgagattctg aatatggtgc tgaggttgtg gtacttcggt gagtctgaag 5400
aatggttact gcaggcagtg ttgcttacga tttagctgtg gcccttcggc ctggggctta 5460
caaatttaca ctaggcattt gcgtttcccc ggtaaaagct ggttgaattc ataggaaatt 5520
ggcataatga tagtgactgc agctgatccg gatcctaaga aatcatagtc ggcagaaata 5580
gcatcgtgca tgtaattgca gtattggtga gttgttctct ttaacgtctg agctgaagtg 5640
taatttgtgg gcagaaataa actatataag tacatataca ttagtgggat ataaacaaac 5700
tgataggtac accagtggct ctgataaata ttactccctc catcccaaaa tataacaact 5760
tttgggtaga tgagacatat tctagtacta tgaatttgga taggggttat gtccagatcc 5820
atggtactat gatacgttcc atccacccta aaatcgttat attttatgac ggagggagta 5880
actgctaagt ttctgatgtc ttatgtccca aacgatggta gctcctaagc tctgtaatac 5940
cattgtcttt ccagaaaacc acggttacca ttgtcttcca attggagaca cattgatagt 6000
gtaactgttg tgaaagattc tagctcaagt atcccattct cttactgttc tgcagccgag 6060
agatacatgc tatgtcgcgg acgaagggct aacagatttg agatatagtg gccatcagcc 6120
tcatgcacat tcttgggatg aattccctgt gctcaaggat atcctgaagg cggtgagagc 6180
tttgccatga ttattctttg caatgctata tatgatttgc agttaatttc aagcattagt 6240
attctaaata gtatcaacta gtttgtattt gatgatgggc atctcaaagc tctcattcta 6300
tctagtgatt tgctgattaa tgtatgttca ataggttcat gaagccctcc ctgggagcca 6360
ttttaacagc ttgctcctaa acagatacaa gactggttca gattacgtct catggcatgc 6420
tgatgacgag ccgctgtatg gacctacccc agagatagca tctgtcaccc tcggatgcga 6480
acgagagttc ttacttagaa agaagccgac gaaatcgcaa ggtaagcggt gcacacacta 6540
ggaaaatttt tggactggca gcctcactat catttgtaga ttttggagtt tagatcacat 6600
caactccgaa atcgatccct attatttccg tcgaagaaaa gattgatccc ttttaatcta 6660
ccatccagct tcacttggat ctggggaagt tgcgccgaag cggctcaagg tcagtgctcc 6720
tcagcagcat tctttcctcc tgaagcatgg gtcgctgctt gtgatgagag gctataccca 6780
acgggactgg cagcactcgg tcccgaaacg agctaaagca agctcaccga ggatcaatct 6840
gactttccgg cgagtgctgt agcatctttg tgtacagcgt cggaggcagc ttccgggcag 6900
gtcgggcggc tgcctgggct ccatcgctgg cgcgtacact agagactatc tataacatgt 6960
atataaaaat taatagatca caggaaaaca ctattagtca cacaggagcg atggtgtttg 7020
ccactgtttg catggtagcg atcttatctt tgcctccctc gatcttttgc aattgtgcaa 7080
acttatcacg gacattgttt tggggagact tgatgtttgt gttctgcaac tctgttagtg 7140
catcatacat tctggcatca tgttgtactt gtatcagcta gtccgtactg tgtgcaccct 7200
agtatgcgca gaccttagga tttggtcaaa ataacagatt tagagagatt tttcgttagt 7260
actagttact gccctgtttg cgtctagttt tgtgtgaacc ctgtaacaaa tttgacagta 7320
atacacggct aatgctgtgt ttctggaaaa ttttaaaatg tactggttca agtttcaatg 7380
attcatacat ctgaactcag ttgaactttg tacagatggt tacactggag tcaaaactct 7440
taggacagaa tatcattatt atgctcaaac ttaacatcat aacaccaaac ctaggctgcg 7500
ttcggtagta gtagtaccca atccatctct ctctttttca cgcgtacgct tttcaaactg 7560
ctaaacagta tgttttttat aaaaaatttc tatacaaaag ttactttaaa aaatcatatt 7620
aatccatttt aaaaaaaaat agcaaatact caattaatca tgtaataata gacttcattt 7680
tgcgtgccgg ggaggactcc tcccgaacag agccctaata taggatctac cgatttactc 7740
atcagtccca aaatataaga aattttgtac ggatggaaca ctccagattc gttacactag 7800
gaaatgtccc ctccgtccaa aactccttat attttgggac ggatgaagta agtgctaacc 7860
agttcagaaa acagaaataa tgttcaacac aagcatatgc tgtgatacag catctgaagt 7920
atcaactcac atgtcacatt ctacatgcaa aatctgctgc ttcagaataa ggcaccccaa 7980
aattgggatg cccattctag ttgtacagta caatccaaga accattgttt attgtttaca 8040
acatttctac atgagtttta acacataatc actattcctg caaaataatg ctaaacggat 8100
atgttacatg acctgtggcc ctctcaagga tacgtataca atgaaattcc agggcacaat 8160
gccatagcta attaagttgg aaacaagttc tagcatctag taacattaga agcaaatcct 8220
attccactgc tcttctatac taaacctgtt gctattgcaa agaacatttt ctacatcaca 8280
actgtcaatt ccaaggtcaa ttaaatgaga tatccacatc cccatccgct gcccgtgaaa 8340
tctgcatcct acgaagaata atcaaccgag aaagcaaagc ctatgttgct ttagctgtgc 8400
gttttttcca gacactctgc acatttaaca caaacagtaa aagaactgta acagtaagaa 8460
tgaggaagac tggtacaata ggttcagagc acaggcgatt ttcttacaag agtctcgttg 8520
tcagattcct ccttgctgtt taaattatgg tcatcaggtt cctcctcttt tggctcataa 8580
cctttgccag acactttctc agcttttgct ttcttggcta ctactacttc tttctcattg 8640
cgtccatctg agataacaga acaattgtgc tctcaacttc cttgcaagaa acagcatgca 8700
gattatgggt aaacagtgaa ccgtaaaatc aaccccaaat tatcatacca gattttttat 8760
cattatcaga atctgagtgt gcgagagaac ttgatgaatc cgaatcaata ttcgcatcac 8820
cggcagcatc aacagaactt ttacccccta tctttctgcg tttgtttttc ggcagtcctt 8880
ttggtttgcc tttcctcttt gggggtgagg gcctgcaaga taggggtaag accaattgca 8940
ccaaggtttt caagtctaat cattttatat gggcttacct cttttttgac ttctcttgtt 9000
caggcggcgg agtttgcttg ctgctggtaa tgcttttatc ctgagctctg caagttcaga 9060
ttacatatca aacaaactga tgtctatgac acacgtatca gtatgaaata attagaggtc 9120
ttaaatatgg aggagctagt tcaggtggca taagacatcg tttgttcctc ttggttacat 9180
gaggattcta gaatcatctt attctatgat aaaatgcaag atgtagtcag gagatagcac 9240
tttttgttta gttgttgaac taattactgt tcaggatgcc taattcccca gtgctgtaca 9300
ggacattttc ccagatgctc cagtgaagtt tattatgcag tgcactatat gcaagaggaa 9360
aatccagctt accgtccttg gtttctccct gaatgatcct tttttcgggc ctgcaataat 9420
ttgtaaacaa caataaacaa aaaaaaaact atgacctaat ttaaagagag tttttatgac 9480
acaatttacc atgctatacc tttacaggcg ggtcatcact tgcaacaatt tcccactttt 9540
ctttagctag gttaagcact tcaacatctc catcatcata tagcacctat gtagagaagc 9600
agtcttttaa atatatctgg tatatggtgc attacaactt agaattatat tccagtttga 9660
actagaatta taaatcatac aactgttgca tgttgtttat gtgctcatag tggttgacac 9720
tactgtagcc tgaaggataa cctggtggca tcggctgcta gtgatgagag gactataagt 9780
tgggggtgaa gaacttgagg gagagattta tagattgaaa ttcattgctc aattccacta 9840
gaccagacaa attcctgaat gtctcttata tataggccag cacctaacca tccaatctaa 9900
tagatagcca actactctaa ataaatcata tctctaagga aacctcctcc tcctctacac 9960
gtgtctcccc ggccatgacc ttatttggtc cgactgtgga ccgtggccct tggcctaatg 10020
cccatgacaa tagtggctga gcaccaagca ttctactatc ttcatataga attgacaaaa 10080
tgaaaaggtg caaagcaatt cattgctttc catacttata tttgtgacaa taaaatggat 10140
caaatagata caacatgtcg ataatttaat gcaccatttg agggaacata ccgtgtgtct 10200
tctttttgat gaatcaaaag attccacaac accttcataa aatctggtaa agaaaaaagc 10260
aattaaaatc taggccatct tcagaaatta gatagcacat gaagaataac acagatagag 10320
aactcacttc ttatccaacg gccaccaaac ttttattctc tttccaatca ggtcctcact 10380
gcctgtgtca tgtgttgtgc actgcaggca ttaattggtt cttagtaatg atgtttgaat 10440
gaaattttca ctggagttga acaaagtgaa taccattggc acacatactt tattctagtg 10500
attttaattg aaatattgca tgaaatttct cgacatgtca gaatttctta cagaacaaaa 10560
gaaaacaata gagacaacct ttgctagacc agaaaccaat tttggcttct gccttttgat 10620
cgacccattt aaacttcccg aatcaacagt tcgcttacta ctgcctgcct catcagactt 10680
ctgcaagagt tcaacaaaaa tcaatgaatc agaacctgat tttcacctgt agatccaata 10740
gatacagcca tacagatgga aagaaattac ctttggacta ctactcaaga tttcagcgtg 10800
gggcttctta gcaccctttt tccctttgga tacaggggtt ttaacactag caggcgatgt 10860
taccaactca gtatcaaccg agtcatctct ttttttggcc ccctcaacct tattttcaaa 10920
tgagttgata gtttcatctg ggtcaacaga ctgcagtaga agctcatcac tgtttttgtt 10980
gcctttcgtt gaatgtggtc tactcttaga aactgatctc ttgcgttttg gtgttgaaaa 11040
atctacaggc ttgtcattac tctcttttgc atccatccgc tttttctttg gtttgctctt 11100
ttctgattcc cccaaatttt cttgattgtc caagtttatt tctctaacca gtcccaagac 11160
atcatcatct ttttccatgt ttattgaacc agattttgtc ttctgctttc tcccagcctt 11220
ttttgctcct tgagatttta aaattttcac aatttttcct agaggaactt cattaccaaa 11280
ttcatcagtc tcatctataa gcatcttatc cttgggagat tcaacctgga cggagagaaa 11340
gatctaacgt caaaggccag cagacaattg atgctgagac acagtatgga cagaaaaata 11400
agcattatgt acctcagcag actttgctgt cataagagcc tcaaaatggg ccaacacatt 11460
ctcgcaaccc ggccatatct gctcatcact ctcctacaaa atatcatata atgtcaaaat 11520
aagaagccta gaagagaaaa ggcaagaaag tgacacaaac tgtaaagcaa gtcttaaatg 11580
aatgggttgt ttcatgcttt gtcacaggct taacaagcat atatgacata ccacagaatt 11640
ttcattctga tccttctgaa ctggcgcata aagttgactg ggcagtgaaa ctgtttgagc 11700
ttctgatata tttatctgct cttgacataa tttctttcca ataaggatac caagatcaca 11760
aatagcatgc agtgtctgca aacaacatac ttcaaatcta agtcatacca aatagcaagc 11820
aagatgtatt acagtggatc agcacaaatt taaaacaaat gaactcatta attaaaacat 11880
tttcacacct tggtcttgtt aacatcaacc acatcttggg aatatttgat acttttaaat 11940
atagatacta ttgttgtgaa gctctccttt ttcatgcctg gtacactgtg ctgcaaaccc 12000
tcttccccca ggaggatcaa aagaagcaga tgcaatcgcc tggaaagagc tttttgataa 12060
gcatatatat gcaagtacag caacaatttc agctacaaga atttacgagg gtattgcatt 12120
cgatttatta ttctcaaaat tcaacaatca cagaacaaac tagagtctgc caagagacca 12180
taatttaaca gccataagtg tgattttgaa ttgagctaat tgacattttt tactggaata 12240
aagttgggct ctaattgact tttctcataa caaatccatc ccaaatgtta tttgcacctt 12300
tagggttagc aatctgatgt ttcacacgca aacttagaat tgaaagtgga attagttaca 12360
gcagcataca cttgtatgta cagtgtattt gagcagtgat caagtggtac tatgaagaaa 12420
aacgcaacgc cattacaatg atatcgttga agaaataaaa tcatctgatc tctttcagaa 12480
gatagcagat aattgaccaa cgatttaaaa gtctcatatt tccatgagtt gagggcatca 12540
attaaacaac attactagag ttgcttctac ccccaagtga ttataaccct gagtgattat 12600
aaagcatgat ttaatgatgg acggaaatta gttctctata agttacatgg gtaaaaaatt 12660
caatagacag attaaaacag aggcactatg tgaatgaact ggtcattatg tttggagctt 12720
aaagtattct tttcctccaa gcatgaccgt ggctattctt tttaatagat cagcaaggag 12780
aagggtccca aagtcaatat gttgggaaga gtctcataag ttgttgagta gcagggtagt 12840
gttggtgcca aggcttgtgt attgatgtgg ttttgcttgg gtgagtgtta tgttgcccct 12900
tttcttcgtt tgttctcttg gatgggtata gtgtgactaa ttctattttc cactcaagga 12960
tgaataaaca gagccccagc catctgttcc caaagaaaga aaagaacaag caaactaatg 13020
gtaaattggt aataagcatt agaaaaaaaa actttgagcc attattagat accagtaaat 13080
tggaccaaat gcttcaacat cctcatgctc ttcaatgtta ggacatgatg gatcatgaga 13140
gagggcatga accaaatagg aaatcatata ttctggataa gcagtgagca catttgtttc 13200
cgcttggaca gaaagttggc gcatcttaac ttgctggcat atctgcgcaa cctcaattat 13260
gttgtgctta aactgagaag ggaaagaaaa caaaagaatt aaagaaacat attagaatga 13320
gtacagtggt ggaaatcaat taatttttcg agtttagagt atgaacctct tcatactgtg 13380
gggcatgata atcatccata gctaacaaga aagcacaagc atattttgca tccaaggccc 13440
tttccttaat atattgatgt actttactaa gaaataattt cctcacctga ggaacatcat 13500
cctggtaata aaagaaacca taaatctcca aagaagatac aagtgaatca tgtgaaagga 13560
acagtaagag tatgctaagc tgtattatgc acaacgcata cctgtgaaat cctgagagtc 13620
aaatagaata catcaacagg cactttgtgg tcccattgtc ttgataagcg gagaacagct 13680
tttgctgccg ccagcctcaa atgggcctta tcaatagtgc tgcaagtaat ggagtagtga 13740
gaaataacca aacacacaga caaagagaga gagaagaatg gcacattaaa aagcatatct 13800
gttggtagtt tgctaccttg aaatcatatt tgcagaaata tcaccatatg taaggatatt 13860
cttaaggatg cccattaatt tttcaattcc cggatgtgct tgagcatctt tgcaaggttg 13920
acagctcttc accaaagttt taatgccata aatctaggaa gaaaatacaa aacaacatgt 13980
agaggtcaat taactttgat ggatggattg aagtgagacc tataaaacca taatttcact 14040
aaccttcaat aaacaacttt gagtactatc actccattca gatttatgag cagaaacgtc 14100
gcccgaatcc tggtgatgca ctccgaattg caataaaaat ggaaataaaa tggagaagga 14160
aaggagaaat ttaaagagcg taagtcttac atcattgcag tcaagaattt ttttagttat 14220
aaaatttatt atctcttctc cccttgtttc aaaaattggc attgctatct gagctataca 14280
ccccaaggat tgtaagatgg atggcaaatg cactttcttt tcctccaaca agtccacaag 14340
cctctgcaag gttacgaatg tagagcataa catgttagaa atctcaaata tatgatccaa 14400
gaagaaacag ctaacaacaa atttgaacct tgtaaagaac agatagagac atcaggccat 14460
catcttttgt tatagcagcc aaagcatgaa cagagtattt tgcctgcttc cgtgttcctt 14520
ccaaacatag ccgctctagt agaagagtaa tggaactgaa acagaaggca cagcatctta 14580
gttctatact cttatatcct tattaagtag tgaaaagaat aatgtctcat tcatttcaca 14640
aaagttgcac cttgatgaag ctagttgttc acgaatgttg ccaccagcct tcgacagaac 14700
atgagcaata ccctctttaa gtagttcatt atcctccttc aggagctcaa tgatatcttc 14760
ttcaagtcca gacaaaagtg aagggaagaa actagatact gcctgcaatg tgtaaaacaa 14820
gaagtaatgg gaactgtcct gctgaagcat gataaagcaa atacacacaa gggatataga 14880
agagataaac ttgctcagga agaaaaatat cgggcattca taaacataag taatctagta 14940
acggttactt gctagctagc ctgacaatgg tctttcaaca gcaatgctcc ttgctagcta 15000
gcctaacaat ggaattacca cacaacccca cgcaggcaac tcctgaacta gttgttgcat 15060
gcttccttca tggcaggaaa ggatgaccaa aacgtttcaa caaatcatac cgttaaaaga 15120
tccatgcatg atgacataag ttttgtattc ccagtagatt tttggtcaga agcttcagaa 15180
aggatctctt tgacatattc cttgttcaca agtaaatatg agcatctcat cgacaacgtg 15240
ctcacaaaat catgtaatgc atgtttttca ccaagtttcg ttagcaaatc aacctgcaga 15300
ttacaaataa tattcaaata tagcagcata caagtaaatc aaattaggta actgaaaagc 15360
aataaaaaaa gtcaagtata cacccttttt ttcatatgaa gagttcatat tggtcaagaa 15420
taatgcagaa aatacaataa aataactatt atagaggcaa ctatacctga ctacatgcag 15480
cactggatga gataaatgga accacaaaga agaaaagcta gtgttgcaaa caagctaaaa 15540
gaattctttt tcttaacata tactgctctt ttttctattt catattgcaa gccaaacaaa 15600
ataatcatct gtaatctgta aatcaaatgg agtagcaggt acccgaagag accaatcttc 15660
gttgaatgtt gttgaacaat caagcaagct tgtgaatata ttccagatgt tggcatcttt 15720
tatctgatga agcatgttca agtactcctc agactttgta tgatcattga acaaacgaga 15780
catgctccgg aaacacccca ggatcttttt tttcatatca ggggtatctt cctgcttgca 15840
aaaggaactg ataagatagt gatagaacag acagtaattc tgtagtgcat ttgactattc 15900
aagattcacc aacctggctt gtctgtcgaa gggacatgta cttcagcatt tcttgttgta 15960
gcctgaaatt gaagaagcaa caatatatca gagagagaga caatttatca aactaaacga 16020
tctctagaaa gtaaaaatag tgccagacct ctgtttttgc agaaaaattt gctcgagagc 16080
tttcatctca actttgtcga aatgtgtgac agcagttacc caatgtttca ctctttcctt 16140
tgttggatac tctggtggga acaatgaacc acataaaatt gattcaattg actctggtct 16200
gcatcaaata aatcaaacaa atcaatgggc atcacctaac cacaatatct tgccacagaa 16260
agaaaaggtg atgttatgga attcttgtct gatgtgttgg tgaaagagca atgtgaaatg 16320
ctattaagaa aatatcatgg aaagagtacc ataggaagca tgaaacatta tagatggagt 16380
agtacataga gcatatctta gaggtaagca aagaacagca agatatcttg catgtacaat 16440
ggggattgag gaagcatgac atctgatcat aaatattgag cagtttacag gtttgtatat 16500
aaagcataat acaaatcgcc acaaggatat taagtaccct tacctaaaat ctttgtcata 16560
gaggcatctt aatatttttc caggaatcca ctcaaaatca tcagaattta ctgagctatc 16620
agaaccactc tggcaataga acttgtagat gtcagccaat ctctccatgg tatagcactt 16680
cacagaaacc tgattttttt aaaaaaccaa ttatacacca tgcattcaag tgaatcgtac 16740
agattatatt catcaaacat aaatattgaa agatgcagca aggggcaaac agaactaact 16800
gatttatcac ggacacgctc cgcaacttgt ttgatagttt caactgggac tgcaccaagt 16860
gaatggcaag ctacatcaca aatagcagct accacttgct ttctcacatt ttcctcataa 16920
tccaacaatc tgtcacaaag tgcctctgcc aaggagacaa ccatcagtac aagcacaaat 16980
gatggcacat tcagattata ttatcagcta ttcagcaaat agctacttac tgataatctc 17040
ttgagcttca ggacgggaat ggtttgacat cagacatttt ttcaaatgct caattacaga 17100
aacacgaatt tctacagctc ggtcagtcaa tctcttcagg aactcatcga aaagagattt 17160
aaatgattcc aagataggga ttccaggtaa agagaaaagt tcgccaagta tttcaactgc 17220
tttagaccga gtttcaactt catctgccta gaaaatgcca attacaaact ctaattaaca 17280
aagacaaacc aaaatttggt cacttaaatt aagatatatg gatttttttt ccggaagatg 17340
gaagattatt ttctgttccc caggcaataa ttatttcata ttgcacagta ttgctttaag 17400
tatataagta aggttctaca taccagcagt tccccagtta tataaggtac caccacttta 17460
agaacctttg gagcacactg gtacaaatca aatatgactt cgtgatggtc aatgctatta 17520
ttggtagaag taccatcccc atccaaggat gatgtcagaa tcttccttat gtatggttca 17580
agttttcctg cagagtgctc tataacatgg cgagcaagct tgcgtgcagg caaagaaaca 17640
ccctagagat taaaaaaaaa attgcacatt aagacttatt gaaggaataa gtaaaggaaa 17700
aggacaaaat aatagagaag cagtttctct aacaaatcac agaataggtc caaaaaaaga 17760
tttaaaaatg gaaggcactc acagtttttt tccggcctaa agttgataga agtacattga 17820
gaaggctttc ctctatatcc tcgctttcat ctataattag ggccattact gattgcattg 17880
aatttacaat atttggctca tgattgtcac tgcatcaatt caaaacacaa tgagtaaaat 17940
atttaagcta tcaactagca gcaatattgc gtgtatgtca cttggtagca ttaatagtct 18000
tatagtcaat aatttctggt tgtgtgcttc tgatttagta caatagaatg aaatatttta 18060
catgtcaaat aacttggctc catgaaacag catactataa ctacactcgt gatggaatga 18120
ggagagatgg ttgatgcggt gttctaagtt gaggttgtta gcatatatgg gcttcctaaa 18180
ctgcaagagt tcaaagaaat caatgtttaa aacatataga gcagcacccc atatatcaaa 18240
actgcatgtt aacctgcatg agtgtaaatg tgggcatcca ctcattaact tctctttgga 18300
aattgaaggg tcgatagctg tatcatgact tctcaaaaaa tgccttaata ctgatcaaat 18360
aggtatgtca ttcaaatgcc agtaaatatg gtcctctaga tttgaattta caaacaagtc 18420
ctttacgcag tgcatatatt gaaaatgagt aagtacacat cttagtcctc aaacagaagt 18480
taaaacagca cttcgtgaac tcatacttga attctattga acattttttt aaaaataatt 18540
agaaacaagc atgataaaat aagtcatgtg caacaatgaa caaaatgtgg aaactagtcc 18600
atgtgcggtg aagtatataa aaccaacaac attacatcca aatggataca gaagtattac 18660
ctgataattt ctaaaaaaga tcggaacatg tctgcaatta gatcattgca ttcaaggtct 18720
aacatgacaa cacatgctcg gtatctcgca actgtttcca gaatagcaac tctcctgcca 18780
aaggatttac cattaacatc attgagtcca ctaaatgtat ccacaatcag atgaaacatg 18840
tcctgcaaat gaaattaaca ataatcctca aatgttgaat aaatatagta aaccgagtca 18900
aatataatta gtatattgct ttctggaagg atgcttgatg ataaatgata ataataccct 18960
taagacatca tcactgtatg gagcttcagg agcagttatt cttgtaattt cacagaagca 19020
tgttgccaat agtactttga catcttcatc gtggtgtttc aagaattcat ctctggcaac 19080
agcctttaga catggttgga tagtttccat cactgaggga cctggtgact gctctactcc 19140
atgtaggcat tctgcagctt gctgcagtac gatcagcatt aatagcatat ccagagctta 19200
cttaagcaag gaggaagcat ttcaagcata cagttagtat tgctacagat gcaagccagt 19260
caggctgtcc aaccaattga ccatattaat tcttttgttt gacaaattag tatacacagt 19320
caggcatgta tacaacaaaa atgatatcct ttaaatgtca agtgaaccat caatgagttg 19380
gaccaattaa taggcaatca aatatagtcg gtactgtact actgctatta ctccctgtga 19440
cccgttctag gaacagtact acatagcaga taaccatatt cttaagaatc aactttcttc 19500
agtcattaat accaacaaaa tttcagtgcc ccttataaaa aaaagtgtat tttttagatt 19560
tttaaccaag cttaaagcct atctgcttca gctaaacaaa ccaaaatggc tgattactaa 19620
gggggaagtt tcacatgcaa actacttgtt tctggagtac aatagttgca gtcgaatgaa 19680
tccaggtaac agtgtaacac ctaagcaagt tcaaaagata tgatccctcc taactatttc 19740
aaatcgggcg ctagctgaaa ggttccatac caaggcaaag agaacaagga aagaacaatg 19800
acctgattca ctctaaacaa tagcagaacc acagtaaaca caagagcaat tcagatgaac 19860
tggcattacg gattccaaac ctaaaaatag gtgtgcctaa acctaccaaa atggcctagt 19920
taatatatag gtgtcaatca aatcacccaa gtgcatttcc acaagtatca ttactgccta 19980
aaaatttcat ttacagataa agtagctgat gatccttcaa taaagatagt ggctgtctct 20040
aactgcaaac tcgataatcc gatctacatc acaatatcca atagcataga gttattggca 20100
ccagcacata caatacattg gtcaaaaatt taaactaggg tacaatgttg gccaactgcc 20160
atttttccta gctgattagc tataaacaaa agaacaaaac agaagtaatc taagagcata 20220
cagttagaaa agcactcaat gttaccccca caacagacaa gtgtcgggat acaaagagtc 20280
caccagtttc agattttggg atctaaaaag taggattcga atgagaacct accaagtaac 20340
tttattctaa gaacattgct gagaaataat accatgtgac catagaaatc aatgtactgc 20400
tagccgacaa aattgccata taaacattat cataggtcta gaagtgcttt ttgcatttcc 20460
gcttaactac tgaacaccat ccactacaat gttaagcttt aatatactaa gatcccaaaa 20520
ccctaacgat aagcgattaa gcacacaaaa caagccaaaa atacacatgg gtcccaccac 20580
tgcacaattg agcacccaaa accttaacat agttaaagtt cactatgttc ttagtcccta 20640
tagaaaatct aatcagccaa aagaagcaaa gagacaccta gaaggaaatc actaagtaca 20700
acagaaacac agcttccgaa ccattaactc cgaattaccc aacgcatttt ttattttggg 20760
aagcccacaa ctatcattca agctaaacca tcaactccag cagcaaaacc ctaatttgaa 20820
aaacacctac cttctaaaat cttgtacctt aaattggctg aataagcaag attcattata 20880
ttaactcaaa tgagctggtg tctgaatagt tcagaccata aaattttttg acaagataaa 20940
caaattaaat ttattctaaa aaaattatct ataaaattat gaagacagaa atgtggtatc 21000
aacaggacat aaaatacttat agatatgaa ggcaaaactc taatatgtaa tatgtcctag 21060
gtctataagt ttccacatga acatgaaatt aatttactta aaagtcagct cactgaccaa 21120
aaatcagatt tttctcttct tcagtacaaa atgtcaatcc accacagaac caacctacaa 21180
aagtgaagaa cttgcaatag taaaaccgca acagcacgcc acgaaactag cgtctttcac 21240
cactaaaacc ccataaaccc taatctggca cgacaaaact gaacctccct aatccagcac 21300
gacaaaaagc tccaaatcgc agcattgcaa ttcatcaccc aaaacctcta acacgccaag 21360
ctccagcaga aaatgccttg cctcccgagt agtcccacca aacacagaac gggaacaata 21420
ctacaagcaa aacgcaccac gtacaccgcc aattccagca gaaacgcggc ctcccaaatc 21480
tcacccaaaa aaacaaacct tcgtctccta attacccggc acctgcacat aaaccgtgcc 21540
ttggacaccc tcccgagtcc caaacagcta atttcaagct aaagcaacca aattccatca 21600
ccaaaaaccc taattcgaac ccaaaacccc accacaatcc cccaccgccc taaaccctaa 21660
acctgccgaa ttcgcccaca gatccaccca aaacccgcaa cctcacaccc ccctcccctc 21720
ctccacaacg ccaaagcaaa agcaaccaac caacccaacc caagcaccga acctcccaaa 21780
gagcagtaac aagtcctcac ctcgagcagc ttggcgaggt cgtcggccgg gtccggcggc 21840
gccgcctcca gcttctcccc gagctccttc agctgctcct ccgctgcccc catccccggg 21900
ccagatcggc cgccaattca cgcacctccc tctctctctc tctctccctc tctctctctc 21960
tctctcgctg gggtttctaa tctgagagga ggaggagcgc cttgtctttt tggctctcgc 22020
tgtttcgaaa attggtgagg aggagagagg cggagagctc gtgaacggaa tgccccagtt 22080
cgggatcggg tttgggtctc tctctctctc tctctctctc tctctctctc tctctctctt 22140
ctctctctcc tgctgctacc gtttggaagt catcatgcgt cgggcacggc gccgcgtgtt 22200
ccgcgggttg ttctccgggg gttgtggctg acgcgtgggg ccaggaggag gggcgggccc 22260
gcgtgtcggt gggggggacg gtgagggggt tctcgggtgg gtttaggagt ttttttagga 22320
cagcgttttt tgttttttat tttggtttgg tttgggcctg cggggtggga tactgggatg 22380
ggagagagat gcgtgcgacg atggggcggt ggattcgggg ttaaactgaa gtgccggagt 22440
gcagtttgcg tttagggaaa tccggtgatc tacggtgtgt gagtgctgag tacagtacta 22500
ctagtttttt ccctccactt tgtattacgg tgttcaaaaa tagttgtttt tttttgccaa 22560
ttatgtcctt attaggaatg ttaattcgcg cacgtgttat ttatcacatg gattctaata 22620
aacctagggt ttatcgggac atgtacgagc agcgtcactg cggcccaagt ggtcgagcct 22680
cgaaaggatc gaggttccac agtgggcgtg ggatggaggg ggcaactagc ggaagagaga 22740
agtgggagtg tgcttagagg gatggtctga gaagcgcccg accgacggtc aatggtggtg 22800
acggcgaggc agggggtggc gcccactagc catgggttgg gagaaggcgg tggagtgggg 22860
tcggcggtgg gagaaacaag tgtcaaccag ttaggttggg tgcgcgcgga ggacagcagc 22920
aagcaggtat tactctgtca aaaaaacaaa ctctagctac gaatatggac acgtatgtgt 22980
ctagatttgt aattaggatt tgaccttttt tagacggagg agataggctg caacaatggt 23040
gtgcaaatgc gggagatagg agtggcatct tagaggagat tgagtgggag aggataaggc 23100
ggagagggaa atgagccgtg ggccagcatg gggtgggtcg tgtatgcata ctagccttcc 23160
cctgcctcat tggttaaggt atgagttata agccaagaaa aacaaatgaa gcaaancgat 23220
attctattct aaaataataa aatgttctta gctgtccaga agctaaagct aaaaacaata 23280
gaaaaaccaa catcaaatct gaataccctc ttgagcggtt gtcggttttc acaataatag 23340
gcttgaaaca aggaaaactt tggatatttt tctgaaaatt aaaaattatg tttgaatttc 23400
ttgaatttgg tggtatatat gctaagcggt tccttagttg ttaacttcct tgagatggcc 23460
cataattact ataatcaaat ggttatgtcg acttttggaa ccttgtttca caaagattaa 23520
cataattgaa tgatttttac aaatatgcat gtgccagttg gagaaacccg agactactag 23580
tatggaagtc atcttttttt taaaaaaaat tttgaggttt caagtaaaaa attttcttgg 23640
ttcatgtaga aagttaggat tttaatttga agttgtagag ttttgagttg aaagttagtg 23700
gacctcccat aaaactatct atatatttca atttaaagtt tgactctaat gtagaaagat 23760
tcgagacttg ggttgaaagt tcaaggccac aagtaaaaaa gtttgaaaat ctgagtaaga 23820
agtatgaaat ctaggtcgaa gtttatttca tgagttgaaa gtttctttta ttttttttcc 23880
aaggctatgt gtggagacct ctaaagagaa gggcatgcca tacggcgcat ggtacccata 23940
tgggaaaact ttgaaataca ataaccacca accattttgc ttaatatgtg atcgctctga 24000
tttataaatg attaatcaaa tacaaaccaa agggagaagt tgattaggag ctcttacccc 24060
acataacttg cccaagtcac atgttccaaa ttgcaatcca tgcagaaacc ttttaaagca 24120
ccacatcact tgcacttgtg tttacttagg taaccaacta ttcgatgttg attttgtatg 24180
gaagtttttt gtttttatag tataatgttt tatgtctaga atttctggca ctaggcagtt 24240
gccaaccgaa tattatacac cagtgttgtg aatattgttt aaaaaagcat atatcatgaa 24300
aaggagggtt atcgtacttg gttcctagta atattgaaat tggtcagaca tctagggttt 24360
ttaagctatc aatatagtaa attgcacaag tgatatacga acttgtaagg ttagtgcaat 24420
ctagtataaa acttgtaaaa tacttgttca tgtgcatgac ttgagtagta catgcaaaca 24480
aaggcaaaaa cgtcacacta tgtctaatct tgctgatgtg gatgttgatt aggatgctgc 24540
actcacacgc gacaagagcg ctaggcatgt tatgtttgga agtagccgta tatactggat 24600
tacttggttt ctattttgtt ttccttttct aacctgcatc cttctttcgt ttataaacaa 24660
cgcctttctc aacacaatta atgtgccttt gggtggacta acatgtataa acccatgtgg 24720
catcctaatc aacatccaag ttagcaaaat taacgtacta ggcatgtagg ccattttgac 24780
cttggttcgt agtaactacg caagttcgta cacaagttag ctataagatt cacacacgtc 24840
tcaatttcat atactacaaa tacaatttag taagaaaaaa aactattgta tctagaaaag 24900
ttatgtattt aaaacacagc atggtatgat tcctaattat cgatacatgc atggagactt 24960
gtcatattta gaatctttat cattacaata gtaaaataca gggacttctc aagatgaact 25020
tatccacaaa agacttctct ccatttattt atttcctacg aaagagttac cagattgctc 25080
gttgcataat ggctcatctg atgcagaatc ccagaatgag gttgtaaatt agaactattg 25140
tctctgattt caagtataga taattttaga ggtgtgcaca agagttgatg acctttatcc 25200
tacagctata ttatacattg aaaaatgatg tctcatttat atataggaga gatgccattt 25260
gtgccgtttc acacaatcaa atatttttct ctttatggct ccaaaggaga aatgcaccac 25320
tgcctttata ttagagatgg caacagttaa ttcactgtcg ggggtcatct ccgcgtcccc 25380
gtcaccgagg tgataaaatt tcaccgtccc tgcccccgtc aaccacgacg gcgctatatt 25440
ttcaccagcc ctgatcacca cgcggtgaac ttttgccccg tggttacccc gtccccggtt 25500
aaagaaacac aaatcaaatc agcacttgag tagttaaaca caaatcagca cttgagcagt 25560
taaacacaaa tcaaatcagc gctggcggca agcttcgggc agctcccggt ggcgcggcga 25620
tggctgcagg ctcccggctg cacgacgaca actcccgcgc ccgcgtcgac cgctgcaggc 25680
gacaggtagc gcgacgctcc tggcggcgtg tcgatagagg gggcgggaca gtagcggcgc 25740
gcgcgagagg aggcgacggc gcgcaaggtg gctggtggtg gtggagtggt ggtggacagc 25800
ggtgcgccgt gcgcctggtg gtggtggttg tgtgggcgac cgcgtgtggc tgcagcggag 25860
agccgctgga ggagaggcgc tcgactcgat ctggaggagt ttgaccaaag actagggtta 25920
gcttttatat atacctgtta attgggcatt agtattatgg gccaaaacgt ttaaaaagtc 25980
tagatttagt catctataca gtaaagtcgg gtcaccgcgg ggggcgggga cggtgaatgg 26040
tgcaccatcc ccacccccgt catccccgat ggtgctaact ttggaaccat tttattcacc 26100
attgtggata gatattaacc atcccagtca cctaaaaggt gaattcaccg cgggaaaacg 26160
gtgaacgggg ccccattgcc atctcttctt tatatgtaca tgaaagctag ggttggagca 26220
tattgctcat gcctaaatcc aaagatacaa agcctatcca aaatggctcc atattcctct 26280
gcattctcca tccatctctc taaatttagc tccatatttt tttaatgacc catgactctg 26340
ttttcaccta aattggctaa atacttgtct tacttttagt tatttatgaa tataatatgt 26400
taattactct taattattat ttttataaat tagttgctct taatgtatat atatccaact 26460
actataagat agggagtgag tttggatccc aagatttaaa aaggaagagg gggggggggg 26520
gatggacaca gagtaggata agatagggag tgggttaggg atatggatag agggggattt 26580
ttgggtgttt ctcttaaaga gaaaagtcta tatttagtta tgcaactatg gctttggtat 26640
gtgtctaagg ctctgttcat ttctggaagt tcccaacctc cacctcccat ttcccgccgc 26700
atgcttttta aactgttaaa cgatgtattt ttaaaaaata tttaggaaag ttgttttaaa 26760
aaaatcatat taattcataa gtttttttat ctaatactta cttaacaatg cgttaattac 26820
cgttttgttt tccgtgcgtg gaggattagt tccaacccac cttgaagaac atagcctaag 26880
gcggagtttg tttcagcttt taggctgaaa ttttgtgatg ctacgtgaaa ttttgatgag 26940
ataagtcatt agcacgtgac taattgaatc ttaattatta caaaattaaa aatatatatt 27000
tatacatagt aattttattg aatgaaacgt accgtttagc ggttgggatg cgtgctcata 27060
gagaaccatg aagtagctat tccaaaacat tgcttagaac gcaccctaaa aaagaccatg 27120
gctttggtcc acttttgatt tctaaatcat gaactcattt acttttggtc catgaactct 27180
caaaaccgtt cgcatttcac cccataagtt caaaccagga ttgttttcaa tgatgtaacg 27240
tcaacatgga gttgaccagg gtgatgatga taataataaa caatagcaaa ataaagaaaa 27300
aaaatactgt gacctacata tgtcaaactt gcttcctttc cttctctctc cataatccta 27360
tatatgttat ttactttaaa ttgctaccta aaatgacaca tgatgccatg tccttaaaaa 27420
ccctaccgtg attatgtcaa ggtttgaaat atgaggcggt tataagagtt gaggggctaa 27480
cagttacagg gtttcatagt taagtgaact ttttttcttc ttaaaaaaca taacagagag 27540
tgcaaaacag aataggaagt gtgatataga ggtggattgt attgcctcta ctaaacgaat 27600
ctggaatttt acattgtaga ccttttaaaa acttatgtta caaatagatg gctagaaaaa 27660
tttatttcta gaatgagccc tttttgcagc accaacgcca ttattactat ggtccaacat 27720
gatagcacca atgacattat tgccatctcc cttgcccctt aaatggaagc taagggctag 27780
tttggttcgt ggccttaatt ggccttgcca atatttgtca atttcaatag tgtttagtgt 27840
ctatttggtt agaagccaaa ttttgacatg cctaaagaaa tagaccattt caatagtgaa 27900
attaggctgt tttgcttcaa tccaaacaca actttatctt gccaagatta gccatgccaa 27960
aacttactaa aatttgatat tgacaaaaat tggtaaggtc aatttaggtc acaaagcaaa 28020
ccagccctaa gtctcggatg tgaaggggtt acgttcagaa cctatttgta aaaaaattcc 28080
aaaatactaa aatataaatt atgtttctta catataggtg tttaatgtta aatgtaaccg 28140
aggacctatt tataattttt tttataaact attcattctt ttgaatttct tttataaata 28200
gattctcgac gcaagtgtta ttaccgttga cgcccttcat attagtgact tagcttttac 28260
ggtgaagagg tacaaggaca attatgctag ccccgcgaaa atgatctatt tctagaataa 28320
gtttttttaa aaatctattt gtaaaataat ttttcgaaaa taacaaaagt aaaaactgct 28380
aaacgaagag ttcctgcatt tcaaacaata ataaactatt aggaaaaaca cgtgatccgg 28440
tgacaacact agtttactcc tctgtgcacg tgggtccagg caccggttac cgtttggtgt 28500
tgtcctgttc cggttcctcg gtgtccagta gttccactgg gtggttggat ggtccgctga 28560
gcgcttgggg cccacgcgta gccttgttct ctggataaga aaactgcact tccatttctc 28620
gtgaaaatgt ctactggtag aacagagtat gggccggccc actaacttag cctaagtaac 28680
atacctcaat gggctctcat agcccaatac cccactgctg attttttttc ttagggcatg 28740
tttaaaatgc tggcaaaata aacctttcga aaaaaaaatt aagtcgataa cattgtcaag 28800
ttttgatagg gtaagttttt ttttgggatg tgtttaattt ggtgcccaca tataggggtg 28860
gaaaaaaaaa agctcgaagc tcacgactcg aatttcaggc tcagcttgga tcgactcgag 28920
ttcggagtct taacgagtcg agccgagaca gctgttttgc tcgttaagct aacgagctga 28980
tcccgagcca gctcgcgagt cactttgtag gctcgttaaa ctctcatagc ccaagaatcc 29040
tacaggccac agcccaatca ggtggccgaa cccagtaaaa actccctccc cgactccctg 29100
tcttctctaa accctatcct atccgccacc tccaccaaat cgcaggctcg caggcggcga 29160
ctcgcaacca ccaccaacac caagcaggct gttatcgtcg ccttctcctt gtgccgtcgg 29220
agcgcgccca ccggctgctc ctcccgcagc cgcagggcca cgctgacgac gccgctcctc 29280
ccgcagccgt agcaccacgc cgaccacgcc actcctccca cagctgcaag gccactcgct 29340
acctcctagt ccctggaggc ttgaaccctg ctggtctgct tcatggatca ggagcgccgg 29400
ttggcaagca tggaatccaa gaaccgtagc aaggggaaga aattgtcaag agcttctccc 29460
tctagtttga ctccagccgg cagccacctc gcctctgttc agaagccacc aagatagaga 29520
cctaaagcaa atccaccaac ctcacatcaa gcaagtgtcg catcaatatt tttcacaatt 29580
tgtagcaatt ttttttccta attttgtcac tgattgaacc attcaacttg tgatgcacaa 29640
tctgtagtaa gtgttctata ggtttgtttt cttattctgt ggtgcactga tgatggacat 29700
agttatatat tgaattggat tatacaagga cctaatggag ggttcattca gttaacgagc 29760
taaacaagct caatgagcca gctcgagcaa gctcgctgag ttgagttgag tcagcatttc 29820
agctcgttaa gcctaacgag ccgagccgag ccgagatggc tttttaaggt agcgagccaa 29880
accgagcgag tcgagctgcc tcgatatcca cccctaccca catataggcc atcaaagttt 29940
ggcaacattt ggaggttatg atattttatt gtgacgttga taaattcctg tgagcattac 30000
caacgtttgt ttacaaacta aatgtattaa tatatcattt tcctaaaaaa aatgttacga 30060
ttttaaatgc catcaatatg aataaagccc ttaatctctc atcctactgg ctgccgtggc 30120
acctaatagc acatggcatg tccacgttgg caacgagcgc gccacgtaag tatgtgatgc 30180
tgcgaaaagg acaaggccag acagagtcac agagctagct gcgtccagct aagcctcgtg 30240
cacgtaccga ttccaatgcc ttctcctgga ggtaagtatt tttgttccac ttgattatat 30300
ttctttggca gatgacgtgg acgctgccac ctggatgctc tggaatccag cgaagtcagc 30360
agtcaaatta acaggtattt tacaattttt tttctgaatt attgtggtcg tgttgcatcg 30420
gtaagagtaa caccaagctt aactttcctt gatcgatgct gcttttactc aaacctggaa 30480
gagatggtaa tattttaatt aatcagtgag aaaagaaaaa ctgatgtgaa cgggacaatt 30540
tgcacgatgg gggaataata atattatttg ggttgggttt tgttaaatac tcctacttgc 30600
tttgtctttt ttctcgacca catgaccaaa tcgagctgtc acaactcgca cgtccataaa 30660
ttaagaatat tatgctaatg cagttgacat tcgacggcag ctagcaagac ggagtagctc 30720
accaaatact attgctatat atctaattca accagcttgg ataaatggtg agctgaatgc 30780
ttgctcaaac actcagactc accaaccata ttatcatgtg gctgtctatc cagattgtca 30840
agattttggt catgtgatat atgatatctc tataatgcat gcatgcctttt taatgaata 30900
gttcaatttc ttacttttgc aggccaattt gttgtttgtg agtggtcaat ctaaaattaa 30960
atctaagata actttgatag gatggatgag tagatttttt ttaactaaaa tgtgaaattg 31020
atgtcaaatt tgcatgataa gttgccgttc caacgaatag cactagtaaa acacaatatt 31080
tcgtgaatgc atgatgtttg aaaatgatga aggtaaaaat taagttgacg cacgtaaaac 31140
aagaaagtca ttagtgtata attaattaag ttttaattat tataaatttg ataaatggat 31200
atatatgata ttttaaagta agttctataa tataaagttt ttgcacggaa tgtacatata 31260
gtagttttga taagtgctaa tgataaccga gctaaactct ataatcttaa tcatagaaac 31320
tcatgtgcta ttcagccagt ttagtcctac cacgttcgtt tggagaacaa aggagtgagt 31380
ttttttcgtt ttccgcgcgc acgctttccg agctattaaa cggtgcgttt tttacaaaaa 31440
ttttctatag aaaaattact ttaaaaatca tattaatcta tttttgaagt ttaaaatagt 31500
taatactcaa ttaatcatgc gctaatggct cacatcgttt tacgtatctt cccaatcttc 31560
tcctcactca caaataaaaa accaaaacat gaagttagta tacctcaact aattaggttc 31620
ctgatagtga aacccatcca tccagattta agttttaaaa ttagcacggg tgcttgtatt 31680
tacgagtagt tattctacca accaagttgt agacttgata cagtcgagtt ctacacttcg 31740
catatcttaa gatatgtcgg attagtcttc gaaagtactt atagaggtag ggtgtcttag 31800
acatatatcc gtctagtctt tgaaaatgtt tatagggatg gagtgtgtat atgtgtacat 31860
tcataagagt gagagtacgc gtgtttatat cagctgcgac tgtactatat tttaaaaaaa 31920
ctaatgcatc ctcatctaac gaactaaacc taccagagag gggaggagga atggtaggaa 31980
cactaaaaac cgaaaacttt tagcggaatt aaaagttacc ttcgaagctg atggagatcg 32040
gtctgaccgg cttgattgcc ctagtttgac cgcgccttgt tgccaatcta accggtgtag 32100
atcgaggtct gaccgccctt cgcgccatcg acgcttgttg ccgccatata actgccggtg 32160
tgaccgagca gttgcctctg gtctgatcgc tggtgatcta tcggtgtgat cgttgcattt 32220
gagcaaaaca caaattaaaa gatgtcttga aagtacgtag attgaatttt attgcttata 32280
ttcgtgttac aaagtacaac aacaacactt ctctcacaaa attcgactaa actcgaaacc 32340
ttaacttttc tctaaattaa actctcccaa aatcaataca aggatatctc aactccctct 32400
ctatttatac ccaaggcaag cagcctaagt cacgaatcta atttgtacaa gaagttctaa 32460
ttcactagaa aaccttcccg tacaagaaac aaacttatct catcataatt cgaatttcaa 32520
tcctcccaaa tttagactcc ttccaagttt gactccgctt ttcatacgca cacaatctcc 32580
cattgaaacg gtcaattagg cctagagggg gggtgaatgg gctaatttaa aaacttaagt 32640
aaatgcagaa gcagggtttt tcagaaattc tgaaaatgct ttacgaaaat tctgaaaatc 32700
acagaatatg cacaagtgaa agtaaattct agatctagct acatacaaca atgaaatata 32760
agcacaaaca acaactagac ttataacggt acaaacaagc aaagctagag gagggagaga 32820
ggtatatcac cgaggttgtt gcaataagag ttgttcccga agtttgaatc cttaagggga 32880
ttatactttc cgttgaggag ctcacaacga gctgggtctt tgctaaccct tttctcaagg 32940
ggttgcccaa agcactcctc cttccactag tggtatctag gggtaaaaac aattggaaac 33000
gatcggaatc gttagcatct cttcggaaac gatgctcgat cggctggtta gtcctcacat 33060
atactcaaac gaaaatgtta gtcctctcta atcatattgt tattaatcac taaaatcatt 33120
aggggcctag atgcactttc acccatttta tgcgacaaag aatcatcata aaacaatgtg 33180
cattgttctt tagactaagc atcccgtatg atattctgat tgtccagaca tcatcttctc 33240
ccaagttgac tctcgatcca tcaccgacaa cgctctcctg aggcatcaag acacacttac 33300
acaggaatca aaacaagaaa ccatatccga gcacaagttc tttcctaact tgactcgaca 33360
ttagcaaaca acaatattac acacatatag aaataatcta gaagtcataa ttatgagata 33420
aacacgagta tccaaataaa caactcaaaa ccaaccctaa tcaagatcca gccggtcttc 33480
ctgcacatac cacaccggtc tgcccggcct tactggtaca gtctgatcga cttcacacaa 33540
aaaaaacact tcaccaataa tcaccaaata ctaaattaat tatatatcat gccaattgtt 33600
catcacaaat taataataaa aacacacttt gatttcaaca attagttaac tgacagtcat 33660
atcgatatat agcaaatatc ggcaataatt gcacaagctc cctacatcta ttctcttagg 33720
ttctcctaga tcgatcacac tggtctactc ctttcatccc ataaaataca aacgttatcc 33780
caaatgttag acaccgtaat actacaaatc tggagaggcg tgattaataa tttctcatca 33840
accatagggg taataataat ccaaggctgt gtttagttcc acgtaaaaat tgaaagtttg 33900
aagaaattgg aacgatgtga agaaaaagtt agaagtttgt gtgtgtaaaa aagttcaatg 33960
tgacgaaaaa gttgaaattt tgaagaaaaa agtttgacta aacaaggctt agtcatggtg 34020
atggtaagtc agcccctaag ctttcacttt gacctattct actctcacac tgacgttgac 34080
attgtatcac agggcaccac ccatcccctc cttaattttt gtttgactat agtaaccata 34140
tcaatcaaat aggtgtgaaa gctaacctag attatttctg atcacactga tcacattctc 34200
actagctatt ctacactttc taccttcaca taggacgaca agtgtaccaa cctactgata 34260
aattatcaag cctcattttt cttataagtt atggccaaaa ttaaaatttt aaaaattagt 34320
tttaaattat tttgatgttg tttcatcacc tttttctagc tttagctaaa atgatataat 34380
tatagagaaa ataaaagtca taacctaaaa ataaatttta gctcattttt tatagcttat 34440
tagccgcaga ctattcaact cgaccctccg tgttttctca tataagccca taccatggct 34500
acgtttgaaa ctacaactct acaagttctc atattttatt ttcttatttt tcacaagtac 34560
gtttttgaaa ctgtaaaacg acgtgtgttt ctaaaatttt ctatagaaaa attactttaa 34620
aacatcatat aaatttattt taattttttt aactaatact acctctatcc tagaaagact 34680
gcagttttgc actattcata tccaacgttt gaccgtccgt tttatttgaa agttttttat 34740
aattagtatt tttattgata ttaaatgata aattatgaat aatactttat gtgtgactat 34800
tttttatttt tttaataaat tttcaaacaa gacggacgtg gttagtattt ttgttgttat 34860
tagatgataa attatgaata atactttatg tgtgactatt ttttttaaat ttttttataa 34920
attttcaaat aagacagaca gacaaacgtt gcacaccaaa atttataatt cataactaca 34980
gtcaaaatgg gacggaggta gtaattaatt aaccttgtgc taataaacct ctttttgtag 35040
aagaaatgag aagttcgaac acaacccgca cacccaaacc aagggggtgt ttagattgag 35100
gggtgtaaag ttttggcgtg tcacattgga tattatatat gatgttgcat agggtgttcg 35160
gacactaata aaaaaaatct aattacataa tccgtcagta aaccgtgaga cggacttatt 35220
aagcctaatt aatccgtcat tagcacatgt ttactgtaac accgtattat caaatcatgt 35280
agcaattagg cttaaaaaat tcgactcgca aattagtaac aatttataca attagctatt 35340
ttttagccta tatttaatat attatacaga tgtccaaact ttcaacacga tctaaaattt 35400
tcgggtaggc tcatcgaaag caaacaaaac gaacccccgc acacgaacgg tcacacgctg 35460
atcttttatc caaacccaaa aaagaaaaga aaatcagaaa aagtcccgcc actacctcta 35520
ctactgccgg ccctaccccc acagattcca ggcgccagct aagcacacac cgacgtgcac 35580
ccctcccctc ccgcatgcgt ttccactctg tctccgctcc acacccgagc ccggtcaaac 35640
ccaaccccgc cgcgccgtca ctccgcaccc gactcactgg cccccaccac ccaccaccgc 35700
cgctgccccg tgggccccgc ccccacccgc cgacgcgtgg gcccccacac gccgccggcc 35760
gcggcgggtc acatgcgcgt agtccaaact ccgaggcgcg cacgaaaaag agagagacaa 35820
aaaaaaaaga aaagagaaat tctttttagg cgctctaggt ataaaaatct actcctactc 35880
atcacctact tttccacttc gattcctctc cccttccccc tcctcttcct cctccgcttc 35940
ctccctctcc tctcctctcc tctccgccgc tgccgctgct gctgcgtgct cctctcatcc 36000
ccgtctcttc cccctccgcg cgccgcccac tcgctgggag gaggaggaag aggagacctt 36060
ccccggaatt cgtgctcgcc ggatcgggct cgccgcaatc catgtcggtg agtggtgctg 36120
ttgatgtgtt tcttttttct actgatttta gagttggtga ttggttgcgc tgtctagatc 36180
gagctgaccc gcctgcgcgt tggattgtat tgattagagg aagggaggct gattagcacg 36240
aggtgtggga aaaattagtt gtaaaaaaaa ttggaggggt taatagatgg gcgtttgtta 36300
agtgacgtaa ggcgaaagtg atgttatgct gttctgggtt agtaaggttc ttggcaatca 36360
gttttggtca aatcttactg gttcataggt gttttggtcg aatttcagct tcagatgaag 36420
tttgtccctc gtttccagga ttattggcgg tcagttcttc atcgttaggc ttttaattgg 36480
ttgaacagga aattggggtc atggtagaat gcgaagtttc tgaaaacata agtagagaac 36540
aaaagtagga gaattttgtc aattaggtac gatggaaggt caccgtcagc ttgttcaact 36600
actgttaggt tcaaactttg atcgtgcttg agatttcttt gctaaaataa ggggatatgt 36660
ggcaaaggga gaataaacca tgatatgatt tttgttactg actatagtgg ctgtaaatga 36720
gaacttgtgg aatcacagaa agttccaaaa aacaatgcag aaattgtatc cttttttgtg 36780
ctttgcctag tccattttct gacttctgag atgaggtccc cgcatcacat agaactgcaa 36840
ttgcaattca atgcattcat gcaacaaaca gacagactac tgtcctataa catgagttat 36900
gacttacgag tagccttgca tattgtacat gcataagcca aagctgcttg tttattgtaa 36960
accagatgct ctgtaccata aaaaccataa tccattaagt tttcttgttt actttgttga 37020
acattatact agatacctat ggtgttgact gttacataac attctgttca ccatttggca 37080
attttccccc cttagtgaca ttcattcttt tgagatttca gtcatgcctt ccacatgaca 37140
aaatgttcca ttcaactatg atgtttggaa ttgggaaacg gtacacatac ttaatgtttc 37200
ttttactaat tctgattgaa agaatgcaac acatctttta atccacatgt acatacatca 37260
atcaatgctt tggagagagt gcatcatgga tcaatcatat tgatggtttt tagtaaacat 37320
tttacagcaa ttatttgtgc acatggccct catacaattt ttgttgggca ttcaaccctt 37380
gttttgaggt gttaaataaa ttatttttta ttatgttgtc aaattgcctg acctttgtat 37440
tggtggttgg gcatctagct gtgcactgtc aataactcct ggcggtgctc ctctttttcc 37500
tggctgttga acttccaatc tgaccattca ttatgttcat atcttgtaca catgtggtga 37560
gatgtcaatt gctgtccatt gtatgttact atattttactt agcattgtt caactgtaat 37620
agacagtgat atatcataca tgtcaaatga aaccaacaca gacaaagcat atgctgtgtt 37680
gtcatcttct tatttcttgt actgttctgt tctgtcttga aggttagctg tgttagtcat 37740
ggcccactat ggattctcaa aaggcatcct ttatgttcat tagtttcatc tttttctatt 37800
ttccaatttt attagatggc tatactcgac tttgttcaca cataatctct aattatcaat 37860
cgtctggtca tgcttggcag gcctcaatca aatgccagcc cacccacggg aaatgggcca 37920
ggattgaggc ctgctgaaca aggtgtagag gtagatacac cctttaatgt ggatcatggt 37980
tcctttctag gaggaagcag gtcgtccctt gcccaagttt ggtgaatggg atgtcaacga 38040
cccagcgtcc gctgatggat tcacagtgat attcaacaaa gccagagatg agaaaaaggg 38100
tgggaatggg caagatactg attcaccctg caaagaaact aggactgaga gggtggaatc 38160
atatgccccc aagacaaact cggtatgtct attacattac tcacgcttat tataatatca 38220
gaatttcaat ttctccctga ttaatataac gatattcctt ttctcttgaa ctacataact 38280
agctagatgt cattaatctc attgttttca tgtgcagaag aaatggtttt gctgcgtgac 38340
atccagtcct acacaatctt gatgaaaacg agttccatgg gttgcaaaat tactatcctt 38400
taattttgct atatacatac tatccataag accttgtaga gatgcccaga ctctactgcg 38460
gtgctagatt gggcatctct taaaactttg aggtgtgtgt atgtatgtgt gagggttatc 38520
agatgcacat tcggataaat gaacttctga ttgtaattct agccttccgt cctgtgacat 38580
tctgtgatgt agtcgttatt cagtgatata atgaatctca cctatttata taactgcaca 38640
ctgtttctct tgctttccga ggaaacaaac actgttttac caaagttggc tgtgctccaa 38700
aagaggatta aattccatat gattctcata ttgcaattgc aattttgatt ctctcaccta 38760
ctaatatgcg attttggaat tttcctcacg tgccaaattt gcatattgca attttgataa 38820
aggatacaag cacagtatag ctcaatctcc ttggcgatgg aagttttctt aatattgtag 38880
gcaccacatt tctagctgat aatgcaacta tcgtggagat cataaagagg aggaattttg 38940
tggaagaagg acctggaggt tgggagtctt cggcctctac tcagtcaaat acaagaaaat 39000
attcctcaaa acttaatgca tgtgatgtag attcaaaaag aggtgaatca actagctgat 39060
aaggtagcaa aggatgtgag atcgcgacag ctaaatcctt caggtttatg attgtcaaaa 39120
tatcttgagt cttgctcatc ctagaaacct ttgttatgtt agagatttga agaaccattt 39180
cagagcaacg aattgtatta caactttaca agtcatgtgc tctgtttctg aaatggaaat 39240
aaaactgatg agttctaaaa aaaaaagatc catacattca tgcctgtaca cggacagcaa 39300
atctacatgt caaagtggat atcgccaaat tggtttcaga atttcatcat tgtgctcatg 39360
cccaatattt tttaattttc ggtgaggaac agatgagcat ctttcgtgct agctgcagac 39420
tcgggtgcac taggaatttc actggtttat ttcacacgat ttatttcagt tccactgaaa 39480
tttgtttgga attcatttgg ttcgagaaga ggcgtgagat acgagacttt gggagaggga 39540
aagggcagtt caatacctga tacttttgct cacttggagc ttgaccggag agaggggagg 39600
gagagtagtg aggggggagc agtcgatggc ggcggagacg gtggtgagca tggcgatgtc 39660
ggtgctgggc agcgccgtcg ggaaggccgc ctccgccgcc gccgacgagg ccaccctcct 39720
gctcggcatc cagaaggaga tctggtatgt gtgcgcacgc ttctgtaact ccataccaca 39780
tcggtgactc tccatggccc ctccgcggcg gcgtgtcggc gacctcggct tccatggccg 39840
ccgccgccgc cgcctcacag ccctgcttcg ccgcaatttc ttttttggtc ttttggtgat 39900
tccaacggat tcaggatcaa aaatgaaaca atccggagag cctattcacg cttcgcattt 39960
cactacccca aacttgtgga ttgtgaccat gcaaaccaaa attccttcag tttcatactt 40020
tcatatgctc aaatttccgt tgttttcata gaaacaaggt tatttatccc acttacatct 40080
tgcaaaaacc aaagtacagt tactcttatc gattttcatc tatacacatg ctagacgaat 40140
gcattgtagt ccaattcaaa tttctgatat attagttact aaccaagatg ctcccatgcc 40200
atgagcgcaa gttccattga caaggaaaaa cactttttta tgatttgagc aagttccacg 40260
ctggcgtcct cgttggcaca ccacgtaagc taaagtggca aaaaaaaaaa gaatttttct 40320
ctctacagtg agtcagtgac aaaaacttaa gtgcaaaatt aaaatgggta tttggataat 40380
cgccaaatct aaaagtggca aatagttaaa ttcccctttt atatttctct cttcagtggc 40440
aaaaacttaa gtgcaaaact aaaatgggta tttggataat cgccaaatct aacagtggca 40500
aaaagttaaa ttcccctttt atattagtcc ttgaggagct acggcaatgt ttgctagcac 40560
cggacaagat catccaataa aaacttagag attatacata acagtgtcac tgttactagc 40620
aaaattttcc atcctattgc atggttagta catttttttt ttgtgagaaa tatatggtca 40680
atgccatttg caatatacct ccaggctcta gtcaatataa gactacatac atatgcgatc 40740
tacattttgt actaggtctc taccaaaaga aggggtttgt atccttctgt tctcttaaat 40800
taatgagacg atttgtagga tctttctttt tcaagggatt gtgggagttc tgactctcat 40860
ggctaacgag gcgctctgaa tactagtagt ttatttccat ccatctattt atttatttta 40920
ataaatttta ttgcttttga atttatattt gtaggtacat caaggacgag ctgaaaacta 40980
ttcaggcatt cttaagagct gctgaagtaa caaagaagaa agatgacttg ctaaaggtat 41040
gggcagagca agtacgagat ctgtcatata acattgaaga ttgcctagac gaattcaagg 41100
ttcatgttga gagccaaagc ttggcaaagc aactaatgaa gcttggtgaa cgccatcgaa 41160
ttgctgtaca gattcgcaac ttaaaatcaa gaattgaaga agtgagcaac aggaatacac 41220
gctacagctt aatcaagccc atttcctcta taaccacaga ggatgagagg gattcctacc 41280
tagaagatgc tcgcaatcga tcaggtagca acactgacga gtcagaactt gtgggctttg 41340
ccaagactaa agatgagttg cttaaactga tagatgtcaa tactaatgac ggtccagcta 41400
aagtgatatg tgtggttggt atgggtggat taggcaagac tacccttgca aggaaggcat 41460
atgaaaacaa ggaacacatg aagaacttct cgtgttgtgc ttggatcact gtgtctcagt 41520
catttgacag gaaagaaatt ctgaaacaaa tgatcaggca acttctgggt gctgattcat 41580
tagacaaact cttgaaagaa tttagtgaga agttgctcgt gcaagtccag catctcgctg 41640
atcacttggt tgaagggcta aaggagaaaa ggtactttgt tgtccttgat gacctatgga 41700
ccatagatgc atggaattgg attcatgata ttgcttttcc gaagattaac aacagaggta 41760
gtcgcataat aataacaacg cgagatgctg gcttagctgg aaggtgtacc tctgaatcac 41820
ttatttacca ccttgaaccg ttacatatag atgatgctat acacttgcta ctagcaaaga 41880
caaacataag acttgaagac atggaaaatg atgaggactt gggcagcata gttacaaaat 41940
tggtgaaaag gtgtggttat ttaccgctgg ctatactcac aataggaggc attcttgcta 42000
ctaagaagat aatggagtgg ggaaaatttt acagagaact tccttcagag cttgagagca 42060
atccaagcct agaagccatg aggaggatgg tgaccctaag ctacaatcac ttaccatctc 42120
atcttaaacc atgctttctt tacctaagta ttttccctga agattttgaa attcaaagag 42180
ggcgcctggt agatagatgg atagcagagg gttttgtcag agccacagat ggggtgaaca 42240
ttgaggatgt tggaaatagt cactttaatg agcttatcaa cagaagtctg attcagccct 42300
caaaagttag tacagatgga gttgttaaga gatgtcgaat ccatgatatc atgcgtgata 42360
tcatagtttc aatttctaga gaggaaaatt ttgtgctgtt gactagggag aagatcactg 42420
ttgtagcgga ggagagcatc cgccatctag catttcatgg gagcaaatgc tcaaagatat 42480
gcttggagtg gaaccatctg cgctcagtaa ctttgtttgg cgacagacct gtggggcgaa 42540
cacctgcact ttgttcacca caatttagga tgctgagagt gttggatctg gaagatgcaa 42600
aattcaaatt cacacaaaat gatatcagaa atatagggtt gttgcgccac atgaaatatt 42660
tgaattttgc aagagcctca actatttata cacttccaag gtccatagga aaattgcagt 42720
gcttgcaaat tttgaacatg agggaggcaa atatctcagc actaacaact gaggtgacta 42780
aactccagaa tctccgtagc ctccgatgca gcaggaggtc tggttctggt tactttagca 42840
taatagataa tcccaaggaa tgcttgatga tcaccatgtg cttaccgatg gttttcttaa 42900
cttcaataaa tttcagtgac cgtgtgaagt taattcctga gatatgcatg tcatgttcta 42960
cccgttggtc tgatacaaag ggtgtgaggg tgccaagagg aattgacaac ctaaaagagt 43020
tacagattct agaagtcgtg gacatcaaca gaactagtag gaaggcgatt gaagagctgg 43080
gggagctaat tcagttaaga aaattaagcg tgacaacaaa aggcgccaca aataagaagt 43140
atcagatatt ttgtgcagcg attgagaagc tctcttctct gcaatctctc cgtgtggatg 43200
ctgagggatt ctcagatact ggaacacttg agtggctcaa ttcgattgca tgtcctcctc 43260
cattcttgaa gagactcaag ttgaatggat ctcttgcaga tacaccaaac tggtttggga 43320
accttaagca gctggtgaag atgtgcttat ccagatgtgg gctaaaagat ggtaaaacta 43380
tggagatact tggggcactg cccaacctta tggttcttcg tctttatcgc aacgcatatg 43440
ctgacgagaa aatgacattc agaaggggaa ctttcccaaa tctcaggtgt cttgatattt 43500
acttgctgaa gcaacttaga gagataagat ttgaggaggg cacctcgcca acgatggaaa 43560
gtatagaaat ttatggttgc aggttggaat cagggattat tggtatcaag caccttccaa 43620
gacttaagat tatttcgctt gaatatgatg gtaaagtcgc gaagcttgat gtgctgcaag 43680
aggaagtgaa tacacacccc aatcatactg aattgcaaat ggcagaggat cgaagtcatc 43740
atgacctagg aggtatataa ggatctaata tagtatgtga gcaatgaaaa tcgcatattg 43800
agcttgccat tgacagatca tggtcctgac caggccttgc atctgatggc gatgatgccc 43860
atgacaatcc agcgttgcgc tatcaaacat catgttgaca acaaagagtt cagtcttgca 43920
cttgagaacc taccctgtta ttatgtaatg acacgtttat atgcattgag atgaaaaata 43980
gacttaaata accatataat gcaacaccca aagagaagag aaatacaata tagacttatt 44040
ttccagccat ttgaacacag cccacaatga gggatggaaa atatacttat tctgtggaga 44100
agtacgatgg gctatcgtgc ctttgggtcg gcccgagtcg tattagccgt gcctgggccg 44160
tgtgtgcagc atgttggtcg ggccgtgccg gcccgactaa ccttggccca ggtacgactg 44220
ggcttgggcc gtgccatgcc gggcagccca tttggctaac tatactacac tatatggtac 44280
tccctccgtt tcatattata aatcatttgt cttttttcat agtcaaactt atttaaattt 44340
gatcaagttt ataacaaaat atagtaatat tttcaacaca aaacaaatat tgtatcaaaa 44400
tatattcaat gttaaatcta atgaaactaa tttggtgtcg tgaatgttgc taattttttc 44460
tataaatttg gttaaacata aataatttta actataaaaa agtcaaatga cttgtaatat 44520
aaaatggaag gagtagtagc tactcgtctg ttaaaaaaaa aagtttcctc ctaacataag 44580
agcaaattgg ctcgacacaa ttcacctgct atttatctgt ctttcgcctt gtaaggtagt 44640
ggtgcaggac tgcaggtgca gcatgcgtac acaattgatc tgtttttact tcttgcaatg 44700
agataagatg gagaacgttg tgtcagtcac tacatcttaa actgcctgat gctcatccaa 44760
aatgagaaag atgttccaaa ttacacattg tgcattccga tatgaatgat ttctcactct 44820
atatatactc tagatgttca gatttttact aagaattgag gtggttagtt gaatggagat 44880
atttttctag ttcggtgctt tagatatgtt ttgcttttgc ctaatgacta ttttttttgt 44940
tttattaagc tatgctatac tacttacggt tataacggtt atagatgaat atagttcttg 45000
tttattatag ctcttctgaa aagtgcagtg tacaactagt tgtgttattg ttaactgata 45060
aaacatagaa atgttgattt aatgagctac attgatctct tcttcgttga tatgagaagc 45120
ttggtttgag ttgtttttat attctaataa atatttgtta ctggaatcgc tccattttcg 45180
tatttgaaaa tatttgatta tgttttttat gtggggtttc tgattccaat taaaaaaatg 45240
aaaataaaaa tggtatgatg gtttccgttc gttatgcatg cgcggaacaa tggatctcac 45300
taatcaagtc gcacgcagtt ctttatatct tgttgattat ggcttgtgaa gcatagattc 45360
accgaattaa ttgggatgct aaattagtca catgcatacc caagcttgca tatgacgtta 45420
tgtagataga gatggccaat ataatgcgct ggaaagtcca aagtgaggat gcaaaacatc 45480
ttatagtggg tagtggagcc atgcaaggac ctggtctaaa gcgcacctaa accgtcatgt 45540
ggactgccat tatagttaaa gttaggggga atatgattct cttcatgtgc acctaaactt 45600
taatatgcag tgaaacgaac gctatgatat gatgataagc ttaattcctc tctctgctca 45660
gactgttcag tgcaaaagct accaacgagc ttgtctcctt gtgcggtcgt gagcttgctt 45720
gtgctaagct tgaagggaga gtcgaacgaa tccatggcgg agacggtgct gagcatggcg 45780
aggtcgctgg tgggcagtgc catcagcaag gccgcctctg ccgctgccaa tgagacgagc 45840
ctcctgctcg gcgtcgagaa ggacatctgg tacgtactgc actgcgctct cgtttatcct 45900
agctcggttg tatcgacttc cagcttaatc tttttaataa tgaataaaaa cccggacttg 45960
ttatccataa gtggatatac acagtcaaaa cacgcgacaa gttcttaggc tcttaattaa 46020
tctcgaaatt gaggaacacc atgaaacact aaaagagagc tcgaagacta ggaaagaaaa 46080
ctagaagact aagctttgaa agtcttctaa atccaagcat ctcgacattg atcatccttg 46140
tgcaacatca acccttccta ttgcttcacc agaatcggcg tcccttgtgg agatctctgt 46200
tgtaacgtca aggggaaaat cggagaagca gaactagtcc gcgctgcctt cgctacgcca 46260
tctccgcctt agaggatctc atccacgaaa catccaccat ccaaacggga aacagtttta 46320
aacactcgtg gacgttcacc cgttcatcta aatggttatg aaaaattttc aaaaaaaata 46380
acatgatagg ttaacatgta atatatcatc ttataaatat gcaagttcaa atttgatttc 46440
tacaagttgt aacaaaaata acaaatttta ctgtgaatat acgtaaacta gttaaagttt 46500
aatttgttat ttttgttaca acttgtagaa gtcgaattta aatctgtatg tttgtgaaat 46560
gagatattac atattaacct atcttataat tttttttaga aattttttag aattatttag 46620
gtggcataca agaaacggat ggacatccac aaagagatta gtatccatct ccacatccaa 46680
acccgttgtt gcaccatctg tcgaatctgt cgaatccggc tgtggacgct cggaggcaag 46740
agctagctca cccgtcccac acacacaccc aacgacgtca caagcgcctc cgaacaacgc 46800
caactgataa cttggcagct cctacgtgcc gacgtcgcgg tacttgccgg cgctcctagc 46860
gcatgcaccg tcgaaccaca ccgtcaccga ccagctaccc accgccgccg acttctgcct 46920
catctgccat cgtcgcccta gcccaagtta tcatcgtggc aattgccgag gctcctaagt 46980
gtgccacggc cgaggcaaag ttctaactga atcagacagc caccaccgac acttctgctt 47040
catctgccat cgccgtacta gttcaagttg tcgctgtggc aatcactgtt gttattgccg 47100
cgccctgacc cctatcgtcg tcgctcttag cgcgtcgtcg agccgaccag ccactgtcgt 47160
gcagatgaaa aaaaaaaaca cattttggcc tgagagatct gcttagttcc attgcaggtc 47220
caacatgctg tgagatgcgg gcgtgccagt cagtttgatc ttgcaactga caagatatat 47280
aaacagcaga taaaacagcc tatcgactaa caagccgatg gagtaattcc agccgatagc 47340
cgatattagc cgatgccgat tctagccgat gtcgataggg ttttgaacta tcggctatat 47400
gtccaatgta ggcaatgata taaagacaat tggctgatga taataaaata taaaaatata 47460
atccaataga aaccaatcgg ctaataataa gtattgatcc gatagttaaa gcatacatcg 47520
gctaaaagtc cgatgtcata aaatccaatc gatttagata aacagtgaaa cctttgttgc 47580
aatcggctaa atccaacttg tatgtaatct tcgtaagccg atgaacgtcc agataactta 47640
tcggctagca cctcgataaa acactagcat gaacctatcg gcttaacaag atttatatta 47700
tcaacaacaa tctagtaggt cggacctaac cgatgcaaca cgtattagat atgataatct 47760
aatactcgat gagccaatag atctgtctaa tgtgatggat ataacaaatc tatttataaa 47820
agcattgcga ttgtagagat atatcggcta agacagaata tcagacctaa ctaaaccgat 47880
gcgtctctaa acacaatgca attaattaga gatataattg agatatcagc taggcaaata 47940
tatcaaccaa actagagcga tccaagagat cggagcaatg cagccttgaa caacaccaat 48000
gtagccgatg gattcaccag ggtcgacgga atgtaggact taccccttcc ctgaagatcg 48060
ggctgaacca atgcagtccc atgtcaggtg ccaaattccg ccggttgata agtaaaacct 48120
cagaaaagag gatgacgatg cgccgagagt agtattgatc gagagataaa ttgcaatgac 48180
cctggatgta catatttgta cccatgggta gatattagtt cttgtaggac aagaaagaaa 48240
ctttcctaaa gataaaatga aaacataaag tttttattgg atactaaaca cactttccta 48300
aagataaaag gaaactaaac cctgcctaat taatagataa actgccatgt cgtatcctcc 48360
ttgaactcga actcttttag ataagcttcc tttaactaat ctttacccga atccatcaag 48420
aatacaaatg ttggcattga tagttttcat cggtcaattc taggactttg aagccgatac 48480
tgactctaag ccgatgacta ctttgggctt accaaatttt gttgttaaca tgtcgcgacc 48540
accatcaccg gccagccacc ctgatcattg ttgttgactc agcattcgcc aggctgagca 48600
gtccacatac atgccgccat ctccatggca ctgtcgttgc cgcccctttc tcctagagcc 48660
gccgcagcgc tcttcgacac acctactgca tcgtcgagca gtcgtgctac cacctcctcc 48720
atcgaccata gccgcctctt ctgctgcacc ggatccaccc acaccaacca ccagatacag 48780
tcaagccctc attcccggat cccatatcca tccatgccac tactgtgctg cccagtccaa 48840
ggaatggagc gaaggaggaa gccccgccgc tgccctcccg gcggccacat gcactccagt 48900
gccttgctcc gacggcagcg aggttggaaa atgggtggca gcggctaggg tttatctggg 48960
gagaaggaaa aggagaggga gggggggggg gagggtccac ttccagctta attagcctag 49020
atcttattga caaatcagtt gctgggtgca caaacatgtt attttttttg catgaccaat 49080
cttgaacact taggtatgtt agttgagtgg acactggtct atctgaaaca tctcttcaca 49140
tggaggctgc gaatgagttt tctttttgag agaccaaagg ttcgttgtat gttaagtgat 49200
aaagccttgg taagaaatgc taccacaaac gaactaataa ctccaaacgt aaagtggagg 49260
aacccgtatg ggtgactcga gtggcgacaa actctagcac ctccacctcc ttggacgggc 49320
tgcggcggtg ctttcggcat cccagtcttc ttggaggcat catctagaat taaggtcttg 49380
ttattgctta gcatgcctta gggcacgtcc agtgtttagt tcgactaaaa cttccatgaa 49440
agccaaacaa aagttctgtt tgaccaccac agtgtaaaaa tcgattgtgg gacccatgca 49500
aaaaaaatca caatctcagc tgcctatgct ctcctcctgg acctgatagc cgtgcacaac 49560
aaatattttt ttaaactgga tgtgttcggc ttctctttaa agatcgtttt ttcctctgac 49620
acttaccaac cggctttcac agtgtggtca gttctttttt tttttacgca aagtttgatt 49680
ttagtcagac acgggaggat ctgttaagca ggcttggaaa tttcggaccc ctccaataca 49740
atattatttt agccaaaatt ttctaatttt ttaatttttc atgaattttg gtaatatttg 49800
ttctaattta actaaatttt gttcaaaatt tcggtctatc agtgacctcc gatcaaatca 49860
gttaaaccga gaaaataaac catgctctta agagagtttg gtatggttca atatcaaaac 49920
ttatagtctt gcaatttttt ctacccttta tctttttccc tgactattta gtatggatcg 49980
tttaaaaaaa agaaagccca ttggtgacca agggcttgtt tgattcaaga ccatccctag 50040
ccttaccaac cttttggcaa tggcaaaaat tggttgttgc caaaaatatt ggcacaaatt 50100
ggctaagcct atgattggtt tctaccaaag ttgaattttg gcattcaatc aagccaaata 50160
atttggcaat aacattttct tatctatgga tataacatat ggcaaatatt ttggcattac 50220
cattttcttt ttgccaaaca tgttattcct tttgaatgac caatcttgac accttatgta 50280
tgttagtagt ggaatcgaca ctattctatc taaaacatct ctttacatag aggccgctaa 50340
taatttttct ttgagataac caaattttcc ttacaagtta agcaacaaag cccattggta 50400
agatatgcta cgacaaatga actaataact ccaaacataa agcggaggat cccgcatttc 50460
ccacgtgggt gactcgagcg gtgacaaacc ctagtacctc cacccccttg ggtgggttgt 50520
ggtggcactt tcggcaccgt attttccttg gacggatcat ttagaaagtc ctattattgc 50580
ctagtatgcc ttgacagttt aggcaacact cttggatggt ggtgtccttt gccctggtga 50640
tctagtagcc catggatgtt tagttatttg gacatggtgt tggatggtgc gctcgtgggc 50700
ctgttgtagg tctggtgcca accagtcatg cttagaaata gccggatagg tgcacagtgc 50760
tagttcttta cttggtggtt tgtgcagcgc tatcgacatg tggtggtgtg ctttttcttt 50820
gtccggataa taatctcata gggctatact cttgttattt tgctgctata ttattatgat 50880
aacttggtat ggttcgtttt ttcttttttt ggaaaaacac ctagttgatc aagggcttgt 50940
ttggttcaag tgcattccta atcttacctt ttcttttttt tttcaatggc aagaattgtt 51000
cattgcaaaa aaaaaagaga taaaaattgg ctaggcttac gttttggttc ttaccaaagt 51060
tgtactttga gaccaaatat atggcaaaat tttggcataa cctttttttt tttgcttggt 51120
tgagcttggt acaaaccaat cagtcacaaa atagactgtc atgaatcacg cctactaaat 51180
tcctttgaac cgaactagaa tatatttgct cttaaaagat ttcttgattt caattggtac 51240
catttactag tagaaactta aatttaaatt ttaaaaacaa aatcataata ttgttgttat 51300
ggaaatttta gtcattttag taattttgta atatatgagt tgggttatac ttgagatatc 51360
ctaaattgct ttaagatgaa caattgctag gtatatcaaa gatgagctaa aaacaatgca 51420
ggcattcctt agagctgctg aagttatgaa aaagaaagat gaactattaa aggtttgggc 51480
agagcaaata cgtgacctgt cgtatgacat tgaagattcc cttgatgaat ttaaagtcca 51540
tattgaaagc caaaccctat ttcgtcagtt ggtgaaactt agagagcgcc accggatcgc 51600
tatccgtatc cacaacctca aatcaagagt tgaagaagtg agtagcagga acacacgcta 51660
caatttagtc gagcctattt cctccggcac agaggatgac atggattcct atgcagaaga 51720
cattcgcaat caatcagctc gaaatgtgga tgaagctgag cttgttgggt tttctgactc 51780
caagaaaagg ctgcttgaaa tgatcgatac caatgctaat gatggtccgg ccaaggtaat 51840
ctgtgttgtt gggatgggtg gtttaggcaa gacagctctt tcgaggaaga tctttgaaag 51900
cgaagaagac attaggaaga acttcccttg caatgcttgg attacagtgt cacaatcatt 51960
tcacaggatt gagctactta aagatatgat acgccaactt cttggtccca gttctctgga 52020
tcaactcttg catgaattgc aagggaaggt ggtggtgcaa gtacatcatc tttctgagta 52080
cctgatagaa gagctcaagg agaagaggta ctttgttgtt ctagatgatc tatggatttt 52140
acatgattgg aattggataa atgaaattgc atttcctaag aacaataaga agggcagtcg 52200
aatagtaata accactcgga atgttgatct agcggagaag tgtgccacag cctcactggt 52260
gtaccacctt gatttcttgc agatgaacga tgccatttca ttgctactga gaaaaacaaa 52320
taaaaatcat gaagacatgg aatcaaataa aaatatgcaa aagatggttg aacgaattgt 52380
aaataaatgt ggtcgtctac cattagcaat acttacaata ggagctgtgc ttgcaactaa 52440
acaggtgtca gaatgggaga aattctatga acaacttcct tcagaactag aaataaaccc 52500
aagcctggaa gctttgagga gaatggtgac cctaggttac aaccacctac catcccatct 52560
gaaaccatgc tttttgtatc taagtatctt tcctgaggat tttgaaatac aaaggaatcg 52620
tctagtaggt agatggatag cagaagggtt tgttagacca aaggttggga tgacgactaa 52680
ggatgtcgga gaaagttact ttaatgagct aatcaaccga agtatgattc aacgatcaag 52740
agtgggcaca gcaggaaaaa ttaagacttg tcgaatccat gatatcatcc gtgatatcac 52800
agtttcaatc tcgagacagg aaaattttgt attattacca atgggagatg gctctgattt 52860
agttcaggaa aacactcgcc acatagcatt ccatgggagt atgtcctgca aaacaggatt 52920
ggattggagc attattcgat cattagctat ttttggtgac agacccaaga gtctagcaca 52980
tgcagtttgt ccagatcaat tgaggatgtt acgggtcttg gatcttgaag atgtgacatt 53040
cttaatcact caaaaagatt tcgaccgtat tgcattgttg tgccacttga aatacttgag 53100
tattggatat tcgtcatcca tatattcact tcccagatcc attggtaaac tacagggcct 53160
acagactttg aacatgtcaa gcacatacat tgcagcacta ccaagtgaga tcagtaaact 53220
ccaatgtctg catactcttc gttgtataag agagcttgaa tttgacaact ttagtctaaa 53280
tcacccaatg aagtgcataa ctaacacaat atgcctgcct aaagtattca cacctttagt 53340
tagtcgcgat aatcgtgcaa aacaaattgc tgaatttcac atggccacca aaagtttctg 53400
gtctgaatca ttcggtgtga aggtacccaa aggaataggt aagttgcgag acttacaggt 53460
tctagagtat gtagatatca ggcggaccag tagtagagca atcaaagagc tggggcagtt 53520
aagcaagttg aggaaattag ctgtgataac aaaaggctcg acaaaggaaa aatgtaagat 53580
actttatgca gccattgaga agctctcttc cctccaatct ctctatatga atgctgcgtt 53640
attatcagat attgaaacac ttgagtgcct agattctatt tcatctcctc ctcccctact 53700
gaggacactc gggttgaatg gaagtcttga agagatgcct aactggattg agcagctcac 53760
tcacctgaag aagttcaact tatggagtag taaactaaag gaaggtaaaa acatgctgat 53820
acttggggca ctgcccaacc tcatgttcct ttctctttat cataattctt atcttgggga 53880
gaagctagta ttcaaaacgg gagcattccc aaatcttaga acacttgtga ttttcaattt 53940
ggatcagcta agagagatca gatttgagga cggcagctca ccccagttgg aaaagataga 54000
aatctcttgc tgcaggttgg aatcagggat tattggtatc attcaccttc caaggctcaa 54060
ggagatttca cttgaataca aaagtaaagt ggctaggctt ggtcagctga agggagaagt 54120
gaacacacac ccaaatcgcc ccgtgctgcg aatggacagt gaccgaaggg atgacgacct 54180
gggggctgaa gccgaaggat cttctataga agtgcaaaca gcagatcctg ttcctgatgc 54240
ccaaggatca gtcactgtag cagtggaagc aacggatccc cttcccgagc aggagggaga 54300
gagctcgcag tcgcaggtga tcacgttgac gacgaatgat aggtcagtca ctccctacat 54360
ggcagcttaa ttaacttgtt tctaattctc ttcttgttca gtattagcca tcaggtgagg 54420
gcgatgattt caactcactt ttcatctctc tcgttttctt aacctgacag cgaagagata 54480
ggcacagctc aagctggctg acgatctcct cccccatcag cgtcgtcatc agcgaacaga 54540
tagggcaggg cttccctgct tctgcgtgca cctcaccgct ctgactcgga gggacatgat 54600
gatcaatgag gcttccagtt tccaaatgcg tggctaacac accaggttgt ccctatccga 54660
ggtatgaatt gatgatccaa tttttttcct tccggtgagg ttcaaacatt tgatgcttag 54720
tttcatgagg gtattctgtg tttcgggttg tgatatgcat aattactccc agtttatggt 54780
ttgatgctga gtttttattt ctcttcttac acgtgcactc ttcatttcca tttcattcaa 54840
aacagaaacc aagttgattg cattgtggag gggaatatga gatcagaaat caaatggtta 54900
gttgtggttt tcttatttcg tttgctatgc gcagttgcgc accaaccgtt tgctagaatg 54960
tctgaaagag cctatgtaca tatggtggcc tgaacattac aagttatcat attttatatt 55020
gttgctagct ttcctttcaa aaaaaaaaaa attgttgcta accgatcaca tagtccagta 55080
gtccagtagt aagatttttg ttaagtttat tgttactgaa tatattgttt ggcctgcagt 55140
tgttatttct ctcaaaacaa aattatttgg tagtctcaag tacaaaaaga aagacagatc 55200
agacaagttg ttttactcta ctagtttcaa attgatcatc tctgtttgtt cttcattcat 55260
tttctttctg taagagagtt tgctaggatg gtgatgtggt catgtggatg atcaaatgga 55320
ctacatcaga cgcatcacac tgctgcccaa cctttaccca ctgtagacaa atggagtgca 55380
ggtcctaaac caggccagaa gtttgttcag tgttcttgtt ccaaaataaa cattctggat 55440
ggcaggttat ttcattataa cattcactct tatagctttc ttagtcaaaa ctacaaataa 55500
ggtctcctaa aaaatgcatc gacgttgata tctgtgtttt ctgccatgca gaatgacttg 55560
ctctcaatgg ttgaagctgc aatcctccat gctcatttct ggctgaaccc aaattggtgg 55620
cttggaggct ggagctgcat gacattagag ataacaatgg ccactttttg ttgccatggg 55680
tgagggtaca tggatcatgc cgctgagcct ctactccgag caagcagaaa actggctggc 55740
tgtagatcga gttcgccatc gccctcaact ttgtcgatgc gatggtgatc atggatagat 55800
gtatgtcaca tagcgcaaag cggagcctcc aatgttcgca accgtactgt aaatgtggga 55860
gcggcgaatt tctcaagggg acaaccatgg aacagaggag atggagcaaa gtagttgctc 55920
ttgctatcat ttcagagctc aggctgatct ctagctcaga taggagtacg aattcttatg 55980
tgtgtgtatt tgatctatga tagtacgttt taagagttga gccagatatt gcttgatcat 56040
tacatgatga tatgtaaaaa atggtattga caaggagacg caggaacagg gtggttcatt 56100
gctctgttta atcttaatct tggagagcta ggatggaaaa ctgagttggt ggttatatct 56160
ctactacttt tgatgttgtc ccaaactaat ttgtttctac tcatgttcgt acctaaaaaa 56220
ggaatatttt agtgattaca gaacttaatt ttctctttaa tcagattatt tatcagtggg 56280
atttttcttt ctctagttct gtatgaaaat acttttttat cgtcaatcct cctaaaattt 56340
tgtgatatca gtattttttt tgttttactg gaatgggctg tttcagtgct gcttgcttgg 56400
acttgctgat tcctccctct ttcctattta taaactcatt tttcttcagt tttttttcct 56460
gtattttggt tttctttcct ctacgtgact acacattttg aatcgaacat gctatgctct 56520
gtatatctgc ttggaatact tattaaatgc ataggccggc catttggaat gagcacttaa 56580
cagttgtttg aacacttcca tggatttgtt tcctcagttg tcggacggct atttaaacct 56640
gattaagaat tccatgtgca gagacttgta ctagcgtcga agactttgct tcggtgactc 56700
ggagtcaagt caaggccggc acagcgcaag ccaataagct tcgacgacga cgacgacaac 56760
catgccgcgc tattgcttgt aaactttgtc tacaaaagcc agccgcgatg ccatccatcc 56820
actccttcct tccccattgt tgctcagcca ctcggcgtcg gattttcctc taccacacca 56880
gctctaccaa cctttcccga gattagagag gaagaggagg acgccgaagc cgttgcatca 56940
agcccaggac caccgtcgaa cacctgctgt gcgcaccgcc cggcattcct tcgcttcacc 57000
accgtgtgtg cacagttccc accatagtgt gcaaagcagc ataggtaagt caactccgat 57060
tttctgctgt tctttttttt ttaagataaa gcaggagttc tgctattcaa ttaagcatgg 57120
aagaattttt gggtattttg tgtatattct ggccttgttt agttctcaaa aatttttacc 57180
caaaaacatc atatcgaatc tttggacata tgcatagacc attaaatata gataaaaaaa 57240
ctaattacat aggaggtttt tttccggtcc ttgagggaag gcagtaccat atcctagccg 57300
ttgattttgc atgatctaac ggctggaaaa cctcggtacc gcgtggtacc gcgtttctgt 57360
gagagtaggt accgatcagt ttttgaggtg gaagggtatc attgtaattt cgcgtcactt 57420
atctcgatca acctaaccgt ggacgctgcc ccttcgagct cgtcgctgcg tggtgtatgc 57480
gacggcgggc gtggcgtgac ggcgatatgc gacggcggga tgcgacggca gatgcggcag 57540
tgaggaggcg gcggcctcga tgcggcggcg gccgcggcgc gatggcggga tgcgatggcg 57600
ggcgacccaa gccgagatga cgatgacaac aagcatgcga gattgatcga tgcggccgcg 57660
gtgcgatggt gggatgcgac ggcggcggcc gcagtgcgac ggcgggcgac ccaagctgag 57720
tgcgacggcg gccgcgtccc tcgtcggctc gcgggacgcg gcgggctcga gggggacggc 57780
ggtggtggct ggacgcgcgg cggcaggggc ggctggacgc ttgatggtgg cgggcggctg 57840
gatgcgggac ggcggcggct ggatgcgcga ctgcggtggc cagctggatg cacgatggcg 57900
gcggcggcct cgattggcga cgacgacggc gggctggatg ggcgacagtg gcggccggcg 57960
ggatgcacga cggcggcggc ggcgtcgatt ggcgacgacg acggtgggct ggatgggcga 58020
cggcagcggc cggcgggatg catgacggcg gcggcggcct cgattggcgt cgacggcgac 58080
gggctcgatg ccggcacgga tggcctcgat gccacatctg tttttgttag tccgatcata 58140
cccctactaa atcaatgggc agattagatt ggtacctcat ggtacctcct caaggatggg 58200
aaagatgctc ttgctatgaa gaacctccga gctcggtcaa tgtccggaaa ataacttgga 58260
taactacaag tggaagccat ttttggttgg ttttctgcat gatctgtttg tccctgtttt 58320
attatatcct gtaaactttt cattgcgcag tttgattaat acatgtctat ttgatattgc 58380
agataaatac agttgtagcc tgaaagatag tacttacaat ctattgcttg aaagtctaaa 58440
gaaagttgtt cagagaagga agatcagatg gcggatacag tactcagcat tgcaaagtcc 58500
ctggtgggaa gtgctgtaag caaggttgct tcggttgccg cagacaagat gatcatgctg 58560
ctgggagtgc agaaggagat atggtgagca tctgacttgc agcctaatta attttatttt 58620
cagttgcatt agatttattg ggaccacact tatgcagagt ggtatggtac tcagtttatt 58680
tttaatgatt tatttatatt tttataccat gttctggagg aatgcatatg cagttttttc 58740
tataagtata ttatttgcaa catcttgggg agataaatgt agaggaaagt gaaagtagaa 58800
tgcactggaa gtccctctat atacccaaac acaagtggac atagttttct cacggcaacc 58860
atgttcaatg aaggaataca aacgaggcag ctattaagga cctggtgata atctaatttc 58920
gacagaaaca tggtttcctt cgagtgtaaa caatgtagca tggcatgctt aagtcaaatg 58980
catatacaat ttgacaagga actattagtt tcagtgctgt gtaattttgc tttttgtagg 59040
atcgaacaga aataactaag ccaaccagag aggggggggg ggggggtgaa tagctgtagt 59100
accaaaaacc aaaactttta gcggaattaa aggttaccct tgaatcgata aattccgatc 59160
tgaccgaagt agatacgccg gtctgaccgc ttggatcccg tcggtctgac tggagtatat 59220
cgtccggtct aaccgcccga agaagctgaa gtcgccgctg gtctgaccgt gtcacgcccg 59280
gaaattcact agtaatttcc aaacttattt gtgcataaaa tcctcgtcca ggaatcagcc 59340
gaggtacaca aactgacaat ttaatataca atttaatata cagattcatc aaattaacta 59400
aaacgataag tacttactta agaggcactt agtcctcacc atgaagaaaa ctgcagcgga 59460
aaaataaaat ctagtgaagc tccggctcca ctcccacagg tagctcaact ggggtataag 59520
ccaaacgtct tctccttcgc aacttgtctt caactgaggt tgattggtta ttgcaaggtg 59580
agcatatgac atactcagca agccacacag caaatatgca agtgcacaag gataccaaag 59640
gatggcataa tataggctca tttgcgaaag cagcatttag caaagagtta agagtagtaa 59700
aacagtagag taattaatca gaaattttaa tcaacactga acagcacacc catgctgtac 59760
aggcccaacc atcctgaaca accatacccg gctgtacaga tctaactcca aaccaggagc 59820
taagcaaatt attaccaggt ataagatcca taattattgt gagaggtgtg agactaatca 59880
cgaaaaacat tgctcaaccc gcccataacc gcgggcacgg ctattcgaat agttttactc 59940
tggccagagg tgtaccactg tacccacaag acacagcccc acatcatgtc accatgtgcc 60000
tcagtaccac cacggtacct cggaaagggg ctgtgacatt acccctcgca taacacaacc 60060
caccacagtg cacctttcct ggatcataat caccccctca aaaaccagag gcatggactc 60120
cccagcgacc cccgtgggct tatctccgcc acttctcagt ctggtgctct gcaatgaacc 60180
atgctatacg aaaggtaaag ccgttgccca cgctggcttg tggttggcac gattaatgtt 60240
tcacaatagt agctcgtgaa ccggtcctta attgtcatga gcacgactct caaaaccatg 60300
tgctcacaac ccaccattat caagttttag ttggcaagta attaattaac caatcacgat 60360
tgaccatcgt gaactatcat taagccatca ttaaataata atgagtcata agttatccca 60420
atagtgtgct aatgtttcta agcatggcta agcaatcata tctaatatct agctgaacca 60480
atatatatag ctcaactagt caagttataa taacccaaga tatcaaggaa taaagtaatc 60540
aatgcaaaca ggtcataaca aaggaatagg ttcacaccac ccagtgacat tcgaaaataa 60600
atgcacagtt aaaataaata gagaatttaa atataggatc aacatgctca aaggattgtg 60660
tttgggatct gtgtgacttg ccttgcaata atcggtcttc aattaatctt cttgaacact 60720
tccgacgcac tcgcaaacct tcacaacgac ggaaacgaca agctaacacg caaaacaagg 60780
aaaaaactaa taaaaaccaa ataaacaata cataaaaagt aaacaaacat gtagatcata 60840
tttttagatg aattatgaga cttgaacggc ctcattctga cttcaaatga atttattatg 60900
aattttacaa gattaaatct atttaaagcc cttttaaaaa gaattaaata aatttaattc 60960
aatttatgga caattttaat atgtagatct ttattttata caaattttgc aacttgaacc 61020
acattaaact gagttaagat gaattagtta tgaattttta aagattaaat cggattaaaa 61080
cacttatatt gattttaatt gaattatgac gcaataatga attatttttg aaaaggaaaa 61140
ggaggattat tgcgtcagcg gctagggttt gcggtggacc gggtgcacgg cagcggttca 61200
cggaaacgaa cggccgagat caaccctatc caaaacggac ggccgagatc gatcggtcca 61260
cgaccggctc acgggagacg gggacgatga cgtcagcgat gacgtcacca ccggcggcgg 61320
cggctcggcg gctcggacgc gcacgctcgc cggcgaacgg cggcgcttcg gcacgaacgg 61380
agggcaccaa cgggtagagg gcgacgcggc gaactcaccg gtgaccaaag aagcggcgga 61440
gaagcaacgg acggcgacgg cgacgaggtt gaagcggcgg cggccttcgg gtcaacggcg 61500
gcgatggtgc tccggcgatc ttcggcgacg gcgaaggggc ggacgaggac ggcgacgcga 61560
cggcgaccac gatgacgacc ttcccgagcg acggcgacga ctggaacggc ggcggcgcac 61620
ggctggagcg acggcgacga cggcggcgct aggttacacg gcgctagagc gcttccgacg 61680
acgagagacg aaggcgaggg tggcggcggg tagaggagac accggggatc cttttaaagg 61740
ggttggaggg cgacggcgaa ggcccacggc ggccggcgac gagaaggaaa gatcggggat 61800
tcggaggaaa gagaggaatc cgattcgacc tcgaatccac aagtttccaa accgaattag 61860
gcgatgattc cataagagaa aaggaagagg agatcgagaa gatcatttcc cctctatcaa 61920
ttcggccgga gaaggaaagg atcgaccgaa ttttggaagg agacggcggc ggcgctcggc 61980
tagggtttcg ggcggcggcg accgaaggag gacgacgaaa ctgacagacg ggccccacct 62040
gtcagcgact gagagagaga agagagcggc ggcgcggact aggccgactt gggccgattg 62100
gccggggagg gagaaaagga aagagagagg ttttgggccg gctttcggcc caaagccaaa 62160
agagactttt aaaaaccttt ttcaatttaa attattcatg aaatgcaatt ccatttatta 62220
aaaatacttc cttagctcaa ataaatccca gaaaaatcta ggaattatag aattaagcaa 62280
agtatttaac aaaattttat ctagcccaat tttatgttga gatttagcaa attaaaatta 62340
gatcttctct tctaggcttt taaaatcatt tctactaatt ccttttaaac aacaatttat 62400
aatttaagga tttttttaaa caagaaaagc acttaacaaa tataattaga tcatcaatga 62460
tcaaataatt actgaactgt tctttgtatt atttaagaat tgagctctga aaaatccgag 62520
aaaatttcag agagtataat taaccatgga gaatttaaca aaaattaaat ccatccatgc 62580
tttatattta ggaaatttta tttcccacat ttaacttcac ttgtaaatta atgaacattt 62640
aatataaatt ctaataataa tttattaatc ctgaaacgaa aatcaggatg tgacagaccg 62700
ccgtgtaccc gctggtctga ccgccgcgat gtcgctggtt tgaccgccag tgtcccaccg 62760
gttagaccgc cgaactcaag taaatacaaa ttgaagatct ctcaaagtgg atgacaactt 62820
cattgcttct ctctatgttt acaaagtgca acaacagcac tcctcacgaa aatctcgact 62880
aaactcgaaa ccctaactat tctctcaact caatactctc taaagcgata ccgggaggcc 62940
acaccctccc tctctattta tacatagggt aggcagccta aagccacaaa tcaaactcat 63000
gcaagaagtc ctaatccaca taggaaaact tcccgtacaa gaaaccaact ttacaaactc 63060
aaatcatacc aaatttagac tccttccaaa tttgactcca catcctatac gcacacaata 63120
tttccattgt atgccatatg taatcttcac caaccacgtg catttatttt tagcctaagt 63180
atcccgcatg atatctgacg gtccggacgt caccttatct ccaagttgac tcccgatcca 63240
tcgccgataa tactctcccg aggcatcaaa acacctacac atgaatcaaa caaagaaacc 63300
atattccaag accaagctat atccaacttg actcattatt agcaaacaac agtattacat 63360
acgcatagta tccatctaga agttataagc atgaaacatc cacagatata aaaaaaacaa 63420
cccgaaaccg aaaccaacac agagttggcc gatcagaccg cgggctggcc ggtctgacca 63480
ctcacataac tctggtctga ccggcaaccc atgcccggtc tgaccggacc aaaactctag 63540
tagcacatgt tcatcacctg caaatccaat catctccaaa atcacttcac caataatctc 63600
ctattatcaa aaccaataat ctcagatgcc aattgttcat catagaataa gaatgaaaca 63660
cactttgatt tacacttttc accttggaat caaagattta atgcaaatta agcttcacgt 63720
tcctagtttg agcttccaat ttgtacatat ttgtgattta taatgctata tatacatgta 63780
tacagacaag taacgcagtc cacgtgggat gttggccatg cctggataag ctgagcaaga 63840
tttagacctg tgtcaaaaca atgtcttgaa ttccgttgaa ctttttgttt acaggttcat 63900
caaagatgag ctacaaacga tacaagcatt tttgattgct gccgaagcat caaagaaaag 63960
catactattg aaggtttggg tgcagcaagt aagggatctt tcctatgaca tcgaagattg 64020
ccttgatgaa tttacagttc atgtgggcag ccaaaacttg tcgaggcagt tgatgaagct 64080
aaaggatcgc catcggattg ccatccagat ccgcaatctc aggacaagaa ttgaagaagt 64140
aagcactagg aacatacgct acaacttaat agagaatgac ctcacctgca ccactgatga 64200
gaggaattta tttatggaag acattcgcaa tcaatcagct aacaacatcg aggaagctga 64260
tcttgtgggt ttttctggac ccaaaagaga gttgcttgat cttatagatg tccatgccaa 64320
ggacggacct acaaaggttg tatgtgttgt cggtatgggt ggtttgggta agactactat 64380
tgcaaggaaa atttatgaaa gcaaagagga cattgcaaag aatttttctt gctgtgcttg 64440
gattactgtt tcacagtcct ttgttagggt ggaactactc aaggatttga tggtgaaact 64500
ttttggagag gaagtactga agaagcggcc gagagaactc gaagggaagg ttccacaagt 64560
agatgacctt gccagctacc tcaggacaga gttacatgaa aggaggtact ttgttgtgct 64620
tgatgacgtg tggagtacag attcatggaa atggattaat agtattgcct tccctagaaa 64680
taacaaaaaa gggagccggg tgatagtaac aacaagagat gttggcttag ctaagaagtg 64740
tacttctgaa ttgcttatct accagcttaa acccctagaa ataaactatg caaaagagtt 64800
gcttctacgg aaagcaaatg aagcaatagg agatatggaa agtgataaaa agatgagtga 64860
cattataact aaaatagtaa agaagtgtgg gtatttaccg ctggctatac tcacaatagg 64920
aggcgtgctt tccaccaaag agataagaga gtgggaaact ttttatagtc agataccttc 64980
agagcttgag agcaacccaa accttgaagc aatgagaagg atagtgaccc taagttacaa 65040
ctacttaccg tctcatctta agcaatgctt tttgtatcta agcatatttc ctgaggattt 65100
tgaaattaat aggaaccgtc tggtaaatag atggattgca gaggggttta ttaaagctag 65160
gactaatatg actattgaag atgttgggaa aagttacttt aaagaactta tcaaccgtag 65220
catgattcag tcatcaagag cgggtatacg aggagatttt aagagctgtc gagtccatga 65280
catcatgcgt gatattacaa tttcgatttc tagagaagaa aatttcacac tcttacccga 65340
tggcactgac tatgatgtag tacatgggaa cactcggcac atagcatttc acgggagtag 65400
gtattgctct gaaacaagct tggactggag cattatacgg tcattaacta tgtttggtga 65460
gaggtccgta gaactagagc attcagtttg ttcatctcag ttgaggatgt tacgggtctt 65520
ggatctaata gatgcacaat tttctatcac acaaaatgat gtcgacaaca tagtgctctt 65580
gtgccacttg aaatacctac gcattgcaag atacagatac cgttcaccat atatttattc 65640
acttccacaa tccatagcta gactgcatgg tctgcagaca ttggacttgg gtcagacgta 65700
catttcaaca ctgccaactc agattactaa cttcggagtc tccgtagcct tcgatgcatg 65760
aaagaatatt tttcttcttc tttaagaaca tatttaacta acacattatg cctgcccatg 65820
atattcacac ctttcgttag tacctcggat cgttctgaaa caattgctaa attgcacatg 65880
gccaccaaag gcttccgttc aaaatcaaat ggtgtcaagg taccaaaagg aatatgtaag 65940
ttgagagact tacaagagga ttgctacggt ccagcaggtt gtaccgggcg gtactggtac 66000
cgcgcggtac caaaacccat ctaaccgttg aatccgggat gggtaggatc gggagagaaa 66060
agatgagcaa gggtggatga gggagtacct gtttcgagtc gtcgttcccg gcggcggcgg 66120
cgtggagtac ctgtttcgag tcgtcgtcgt tcccggtggc ggcgcagagc aacaagggac 66180
gccggcggcg cgggagagga taaagtccgg cggcagcgcg agagagaaaa aagggaacgg 66240
cgacggtgcg ggagaggaac aagggaagga cggcggcggc ggaagaggaa caagtccgac 66300
ggcgaggaag aggaacacgg cggcggcgaa aatcatccag cgtagctagg gttcgagccg 66360
cccgatccaa acccatctat tgcacgcgaa gttactcttt tacccttcca actctcttct 66420
ccatgcggta tcacctaagg gacatttttg gtaccgtgcg gtaccacgca acatcagccg 66480
ttggatcagg ccagatccaa cggccagcat ttggtaccgc tcggtacgtt ggacagtaaa 66540
aaaactcgac ttacaaatat tggaggtagt ggatattaga aggactagca gtagagcaat 66600
caaagagttg gggcagttaa gcaagctgag gaaattatgt gtggtaacaa agggatccac 66660
aaaggaaaaa tgtgagatac tctatacagc tatccagaag ctctgtttcc tacaatctct 66720
ccatgtgaat gctgtgggat tttcaggtat tggaacactt cagtgtatag attctatttc 66780
atctcctcct cccctactga ggacactcag gttgaatgga agtcttgagg agatgcctaa 66840
ctggattgag cagctcacgc acctgatgaa gttcaactta tggaggagca aactaaaaga 66900
aggtaaaacc atgttggtac ttgcggcgtt gcccaacctc atggtccttt atcttcattc 66960
caatgcttac catggggaga agctagtatt caaaatggga gcattcccaa atcttagaac 67020
attttcgatt tacaatttgg agcagctaag agagattaga tttgaggacg gcagctcaat 67080
cttgttggaa aagatagaaa tattcagggg ttggaatcag ggattgttgg tatcattcac 67140
cttccaaggc tcaaggagat ttcacttgga tacggaagta aagtggctag gcttggtcag 67200
ctggagggag aagtgcgcac acacccaaat caccccgtga tgcgaatgag ggaggaccga 67260
agtgatcacg accttgcttg tgacgccgaa ggatcccctg ttgaagtgga agcaacagat 67320
cctgtgagag ctcgcagttg caggtgatca cgttgacaac gaacgacagg tcagtcactc 67380
cctacacggc atcttaatga acttgtttta tcctcttgtg agatcgatga ttttaactca 67440
ccctttcatc tctctcgttt tcttaaccta acagcgaaga gataagcaca acttaagctg 67500
gtttgatcaa gtgatgatct cctcctccat tggcatctcc ggtcgtccct gcttctgcgg 67560
ctgcgcacct cgctgctctg aggaggggtg ctgatctaag gaggcttcca ctttcttcaa 67620
ttgcgtctca tgctctcgat tcttccctct cgggtatgaa ttgttcaatc tgatattttc 67680
tcgcgatctg ctactggttc cagcatgagc atttgaacca gcagcttaga attatcgttt 67740
gatcaggtgt tatttatccc ttcttacctg ggaactctac ttatccattt cattcagaac 67800
agaaaccatg tttattacac tatagagggg aacaacagat caggcacgag ttgtggtttt 67860
gttatttcct ttttggtgtg cacaccaggt gattgctaga atgtctgaaa gagcttgtgt 67920
gcatggttgg ctcaacatta tgtgctaatc actctttta taccgttgctg acctatcaca 67980
tagtgcagga gtaaaatttt gctatgttta ttgttactta atgttgattt tccttttcgt 68040
aaagaatatt agctttttag ataacaaaaa gaatattatg tatcctgcaa aaaggtttga 68100
tttggtgatc actggctagt acaaaagtaa cgagagatca gaaaaaacaa agttttggtt 68160
acactagctc attacaattt atttgctgaa catgtgaaaa attaataatt gtcgtacgtc 68220
atggttctct ggaagtctgg ctgcaggtgg ttagttttgt catatccatt atcttggtct 68280
accttttcct actaaactag gactatgagt agaaaaaagt aattgttggt tccaagttca 68340
aaagataggc agatgtgagc taaggaactt gcatttcttg atctccttca gagcttctca 68400
cctcacataa atggatctct gtttatccca aagcaacatt ttttaacctg ctagttccaa 68460
attgatcatc tttgttattc ttcatttatt ctatttctct ccctaaggga gttttctagg 68520
gtggatatgt ggaaaatcga atgcagctat gctgttcaaa ccactgtcaa aagatgcagg 68580
acaggatggg cagatgttta ttcagtgttc ttgttcaaat gaaacatatg ctattctgga 68640
agaggttggt taacttacat tgtatataac ccttaccttg ttactatcct cttgcaaaat 68700
gcatggattg gtgaaatcat gttttttgtc atgcagaatt gttttctgaa gctcaaagtt 68760
gaagctgcag tcttcactgt ttctggcaga acccaaattg gtggcttggt gctgcataac 68820
ctgcagagaa cgcaacggcc actgcttgta gccttcaagg atgctacatt attgatcatc 68880
tcactacggt cccgatcaaa cttctgatcg agttcgccac cactgtggac tttgcatatg 68940
ttgatggagt ggtgcgtatg aatccagggg gcagagccac tgccctgcga ccttggggct 69000
tgtcaacgag catacagtat aatattttgc tgttatttca gtgattaaaa acgaaaattt 69060
taaagcaaac attgaatgca attagatctg cccaggttct caaaatttct ttagctccgc 69120
cactgcttga atcgatgtca tatgctgcaa attaagtgga ttggagatgt gcatatgctc 69180
gaatgttctc ggttatattg taattgtggg gtagcaactt tatcttgggt acaaccatgg 69240
aacaagggtg aaattgtact aattcttatt tgtgtacaat tgatatatct cattacttct 69300
tgcattctgt tagtcatatg tatttccata catcgtttgc acctgctatg gctgcttgag 69360
gatatggcaa agcttaaaag atgatgttaa catggtcaca tggagatgca gggcactcca 69420
ttttctgttt ttctctcaat cttatgtaga gttaatatat ggacagtagc aatagttaca 69480
tctttctgtc aactaggcat actacccacg tgttgctccg ggtctttttg ggatggtctc 69540
tattaagatg taaacttatt tattaaatga attcaatcgc gtcgcattgg ttcatttatt 69600
tagacttggt tgtgatatac tcctgttgta aaatataata acttttacga ttctagcacc 69660
atttataata tttataagag tacctgtctc agcaatcatc aatcattttc tatttagttc 69720
tttctatctt acccttacat acctttcaac actcatccat tcctctggtg aataactaaa 69780
aatgtttaaa tttcagagcg gaggtagcaa taagttctag taaaagctgt tgaatagtcc 69840
cacattggtt gtaaaaggac aaatgaccta acatataagt gggtgagccc tgtacctcat 69900
tagctagctt tttgggtgag gtccctttac gatcttataa ttggtattag agcctggcta 69960
gtttgacatt tacccgaggg cactactaga aaaaggaccg accgccgcta gaccaacaaa 70020
ggaacataga cgagatcgcc ccaaaaaaag cccccacaac caacacaaag cccaactcct 70080
aaagcgtgct tgcaccaatc gttcgagaga tttcggctag gggatgccaa aatgacgtct 70140
tcgagaaaag aagcgatgga aaaccgccgc cgccgtctgt cggggctcaa aggagccaag 70200
actgggcttt cgcccggcaa ccacccttga gggataagac atcacgacaa cgccctcgac 70260
atcacgacaa cgccctcagg aagtcaggag ggggaattaa ccatcgttgt cggtccggcc 70320
aaggccgggc tgggttttca cctgctgctc accacctgcg aatccacggc tgacgcaccg 70380
atgctccacc accactcaac ctctgccgcc aagtgggacc actgcaccgg cgccccctgt 70440
cagccaacct tcatgcgccg aagaccgtgc cacacccacc gacagctcct cctcgcactg 70500
agactgcctc ctccactacc gcccaagcct ctcgcgccaa gccggccttc tctactggac 70560
gcgcctctcg cgccaatcca accttcctcc atcggccgcg cctctcgcgc caagccggcc 70620
tccatctcct ccgcccgcgc ctctcgcgcc gagccagcct ccgctgccag cagttgcgcc 70680
tccctgcacc aagccggctt tcgacccctc ctccaaaggc taccgcaccg accggatacg 70740
gccgtctgcc acgcccccgg ctagccgtcc gagaccgcca tgcctccccc tatggcggtg 70800
gcgatcgcca ccaactaggg ttgaaagtga ttcggataat ttccgtccga ccggaccttt 70860
tttcggattc ggatagtgtc ggtcggatat attcggaaat ttgaatttga aatcatgaca 70920
acttcaaata gcatttttaa atactaaatg atttcaactg aaaaagtcat caacaacaaa 70980
gttgtataac tcatcaagat ttataacttt tattttggtc atttcttcat ccgacaaagt 71040
gatagtaata ttgttcacaa aatttacatc tctcattagg ttttatgaac tataagagag 71100
atatataaat tttatgaaca atgttactat tactttgtag aacataaaag ttgtagaact 71160
catcaagaaa tacaactttt attttggtca tttttctaaa agtttgaatt tgaatttgaa 71220
aatatgacaa cttcaaataa tattttcaaa tacttaatga tttcaactga aaagtcatca 71280
acaacaaagt tgtatattat caagatctat aacttttatt ttagtcattt tcttcgtaag 71340
acaaattgac actaacattg ttcacaaaat ttacatctct tatttggttt tatgaactat 71400
aagagagata tataaatttt gtgaacaata ttactatcac tttatcagat gaagaaatga 71460
ccaaaataaa agttgtattc cttgatgagt tctacaactt ttatgttcat gactttttca 71520
gctgaaatta tttactgctt caaaatatca tttgaagttt tgaaattcaa ctttttaatt 71580
gataaaacaa agtcacaaga aaaaatggcc aaaataatag cagtaaaaac acaataacat 71640
gatagagcat gattttagaa acatttagga aaaagaatca tccaatttgg agttcatatg 71700
agtgagataa actagtttca aatttttaaa ttttattttc gcatacggct ccttaagacg 71760
tccgtatgga aaaaatgatt tttccacgcg ggctattaag ttgtccgcac gcaaaatgag 71820
ctcattttgg cgtcttgagg agtcgtatgc gaaaatgccg acgcggcaag ttgtgatccg 71880
tttggaaaaa tcatagggtc tcgtacaaaa gaaattgttt gtgtagtagc gaggggtttt 71940
tatattccga ttaatattca tcaccgtatt cgtttcgctc cgtatttgta ttcgataata 72000
ttccatttcg tttttatatc cgggtttcca gttccgaaaa aaaagaaagt gaatacgata 72060
gagctagttt ccgaccatat tcgatccgtt ttcatcccta ccaccaccgc agccgctact 72120
gcccttccat ccccgccgcc atcttgccat cctcccgcac cttctcgcag tcatcgagct 72180
ccgacggcac acggcgcaga cggcccaccg tggtagccca caccgccgtc gccacgaact 72240
cctcgccacc accgcctcga ccgccagact ccttcgggcg ctgggtctgc cgtcggcgcg 72300
gctaggttcg cctcaccgac gccatcccct cgccaccccc accgccagac gctgccgaag 72360
gctgccatcc cctccccttg cctcccctgc cgccatcgcc atccccgcca ccagacgccg 72420
ccgccggcca ccatcccgcc agatccaggt gcggatctag cggtttcctc cgtcgccgta 72480
aacgcctcga acgccgctgc caccaccacc agacaccacc gccgcaccgc tcagccccgc 72540
tgccagctgc cccatcgcca gatccggccg ggcggcacag atctgggctg ttctgctgcc 72600
ccgagcaggc ccccctccta tgcccgagca ctaggatgaa gccccgccgc cactgtcttt 72660
gtggccgcgc gactttgccg gcgactgctt gggcagcgac gaggcagagg agggaaaggg 72720
agatgagcac cggcgaggtc gtcgcctccc agttgcccgt ggggaggggc gacacgagag 72780
gccaagcgct actcaactgc ctgatgctca tccaaagtga gaaagatgct tgaagctgtc 72840
gctcgaagca actttcagtc ctcgatataa ttcgatataa gtgatttctc tctccatatt 72900
tgtttggaga aatgctagtt ataagaaact aagtgtgacc atgtgttata gatgtcagag 72960
aaaacagttc attttctcaa ttctcaaggt aattgggaaa atggagaatt actgagcgat 73020
acgtgttgct ggaaaattga gaatcactga tgatcgcctc catctgaaaa ttaccgagcg 73080
atatttattg ctgccaaatc aaaatgattc tattcaaccc gtgccatggc atggccggat 73140
ggccccagtt cactgattga tcacttaata tatggactga acaataaatc atggtacttt 73200
ggttgtcgag catgatcatt atttgtggac cacagattca ccgaattaat tgggatattg 73260
aatcggtcac acacacgacg ggcgtactcc gctcgtctta aaataaatgg attggacgtg 73320
acattatcta ctacaacgaa tctggattag atagtgtctc atccaatcct aaattggttt 73380
attttgtgac ggagggagta tgatgttaac gtagatggaa atgaggaatt gagtagacag 73440
tgtggggctg gaaaataatg gaggacagta acatcttgga gtgtagtgag gcctggaggg 73500
tcgtccttga catccaaacc gcacctaact ctatgataag catcctctct cagattgttc 73560
agtgcaaaag ctaccaatac tgctccgaga gccagaaaaa agcgctggtc gcctagtgct 73620
atcttctatg cagtcgtgag attggttgct ctaagcttga agggagagtc gaacgagtcc 73680
atggcggaga cggtgctgag catggcgagg tcgctggtgg gcagcgccat cagcaaggcc 73740
gcctccgctg ctgccgacga gaccagcctc ctgctgggcg tcgagaaaga catctggtac 73800
gtactgcgtg actctcgtta atttattctg tagatgctca ggaatcagca actattgtgt 73860
tgatttccat cgtagcatat cgattttgtt ggccaccaat tctaatcggc cggaacaagc 73920
tagtcactaa atctggcaaa tcgatcagct gctgagtgca caaacatgca tgttattctt 73980
tttttttttg ggttatatgt taagcaacaa agccccttgg taagatatgc atggcaaatg 74040
aactaatatc gacatacgta aagcggagga cccctcgttc catgcgtggg tgactcgagc 74100
ggtgacaaat cctagcacct ccacctcctt ggatggcctg tggtgacgct ttcggccccg 74160
agtttccctt gaatacatca tctacaaggt gctattaatg tctagtcaca tcatttacga 74220
ggtgctatta ttgcctagtc tgcccgaaga tagtttagac aacactcttg gatggcggtg 74280
tccttcgccc agtgatgtcc aagagcccgt ggatgtttag ttgtttagac atggtgttgg 74340
gtggtgcact agtgggcctg atgggccagt tgtaggtcca gtggtaacca atcatgctta 74400
gcaatagccg gatgcccgga ttggtgcttg ttcttttttc ggtgtcgacg catggtagta 74460
tttacttttc ctgtttttcc tgattatagc atcctaggct atactcttct aatttattca 74520
tgctatatta atattaaaac ttggtatggt ttgtttcatt caagaccctt ggtggtcaaa 74580
ggcttgtttg gttcaagttc attcctagcc ttaccaactt tttggcaata gcaagaaatg 74640
gtcattgaaa aaaaaaggca aaaattggct aggcctacag tttatttcct agcaaagtta 74700
tactttagca ttccactaag ccaaataatt cggcaatgcc attttcttat ctacatgcca 74760
aatatatggc taatattttg gcattaatta ctcttatttt ttttggcaaa attgatcaaa 74820
agttcacatt tttagctcta tagtattaaa agttatctat tcactttaat agaccgaaag 74880
tttactcggt tccgttttta gcactaccgt ctcttttctc ttgatttgcc gtcaattttg 74940
accggcagtc ctacccccag gagacattga gcagcagccc gtgatccccc tctctcgccg 75000
ccggtgacgc tgtggtggca tcgttcctgc tgcgggcaga ataagtctgg cgtcatcgcc 75060
ctatcgcctg gagctgcaac caccactacc gggcccatcg atcgtctaga gcgttatcca 75120
ccctgcctgc cccattactt gcagctccgg ctgggtcaga acctctccat gcctgataaa 75180
ttggttcaag attgtcgctg tccggccagc gcttgaattt tcagaatatg ccatcgaata 75240
cgcgctgctt ttaagatatg ctacccgatt catgctattt ttagaatacg ccatcagaac 75300
acgaattttc ttcgttccgt gccactccgt ctctcggagt cagtcgtgcc gtcgtcatcc 75360
gtccgcccag cactgtcgtc gtcagtccgc cacccgtgcc tgactgtccg ttcagctgcg 75420
ccgtcgtccg tccgtcgccg ccatcgccgt cgtccactgt cgcgcccgca cctgcacccg 75480
tgtcaggcgc gccgtcgtcc gtccgctgtc accatcatcg tcgtccactg cggcgagcgc 75540
agacggctgt ggacggatga ttgcgcggca agcgcaagcg gcggtggacg gacgacgggg 75600
cagtgcacgc gagcacggta gccgatggac tgacgttggc ggcattggga gatggacgac 75660
gacggcatga ttgacgtggg gaacggaatg tcacggaacg gagaaaattc gcactccggt 75720
ggcatatatt ccgaaaatag cacgaattgg gtggcatatc ttaaaaacag tgcctatttg 75780
gtggcatatt ctaaaaattc tcggtcagca taatccccat caatccccaa tccctcaaca 75840
gttgggttaa tattcctgga gatgtgttcg gttgtttagg ttgaagttct ccacttcacc 75900
tccatgagta catgcacctc tacacgtacg ttcttaatgtgtttgtttgt  tctatcctcc 75960
gcttgggttc tattttgttg gttccgatct gatttgatct ggagcggggt cgatcttcca 76020
cgacggcgag agagacgttg ttcgggctgc tcgattaggt tcaactgttt aggtcgaagg 76080
gaggggtaga attgcaattc aagtgcatgg tcagtcaatt tgggtcaaaa ttaacatcaa 76140
actgggataa agagacgaca gtgccaaaat tggtaacggg aaaactttga gttctattaa 76200
agtgaaccag taactttcgt tgctatagaa taaaaacgta aacttttaat gctccttggt 76260
tgagcttggt acaaaccaaa cagacgtaaa ataaacacta tcctgaatca agtctactaa 76320
gttccattga actcaaccag gatacgtaca cttcctctta gaagatgtct tgttttcact 76380
ttgtacaatt ttttctattg taaatttggt acctcgttgt acctaggtac aagaggtacc 76440
atgagatacc aaattttaca ctaaaatttt ggtacctcat ggtacctcct caacgaccgt 76500
agaattgctc ttaatttaat ttaaaaaaaa cataatattt ttaaagcata ttatggaaat 76560
tttagtaatt attacttttg taatatatga gttacggtta tactcgagat atcctaaatt 76620
gcttggagat gaataattac aaggtatatc aaagatgagt tgaaaataat gcaggcattc 76680
cttagagctg cagaagttat gaaaaagaaa gacgaactat taaaggtttg ggcagagcaa 76740
atacgtgacc tgtcatatca cattgaagat tcccttgatg aatttaaggt ccatgttgaa 76800
agtcaaaccc tatttcgtca gttggtgaaa cttagatagc gtcaccggat cgctagcccg 76860
tggatgttta gttgtttgca catggtgctg gatggtgcgc tcatggtctt gttgtaggtc 76920
tggtaccaac cagtcatgct tagaaatagc cggatcagtg cacggtgcta ggactttact 76980
tggtggtctg tgcagcgcta tcgacatgtg gtggtgtgct tttttttttt ccggattaca 77040
atctcatagg gctacactct agttattttg ctgctatatt aatatgaaaa cttggtatgg 77100
ttcgtttctt ttagaaaaaa acctagttga tcaagggcta gttttcttca agtgcattcc 77160
taatcttagc ttcttttttt tttgcaatgg caagaattgt tcattaaaaa aattgataaa 77220
aattggctag gcctacgttt tgtttcttac caaagttgta ctttaacaat aaactaaggc 77280
aaatatttcg gcaatgccat tttcttgtct acagaccaaa tatatggcta aattttggca 77340
taaccatttt tttgtttgct tggttgagct tggtacaaac caaacagacc caaaataaac 77400
agtgtcatga atcacgtcta ctaaattcct ttgaactgaa ctagaatata gttgctctta 77460
aaagatttct tgatttcact cggtaccatt tactagtaca aacttagatt taatttttaa 77520
aaataaaatc ataatattgt tattatggaa aatttagtca tagtactttt gtaatatatg 77580
agatgggtta tacttgagat atcctaaatt gctttaagat gaataattgc taggtatatc 77640
aaagatgagc taaaaacgat gcaagcattc cttagagctg ctgaacttat gaaaaagaaa 77700
gatgaactat taaaggtttg ggcagagcaa atacgtgacc tgtcatatga cattgaagat 77760
tcccttgatg aatttaaggt ccatattgaa agccaaaccc tatttcgtca gttggtgaaa 77820
ctcagagaac gccaccgaat tgctatccgt atccacaacc ttaaatcaag agttgaagaa 77880
gtgagtagca ggaacacacg ctacagttta gtcaagccta tttcctctgg cacagagatt 77940
gacatggatt cctatgcaga agacattcgt aatcagtcag ctcgcaatgt ggatgaagct 78000
gagcttgttg ggttttctga ctccaagaaa aggctgcttg aaatgatcga taccaatgct 78060
aatgatggtc cggccaaggt aatctgtgtt gttgggatgg gtggtttagg caagacagct 78120
ctttcgagga agatctttga aagcgaagaa gacattagga agaacttccc ttgcaatgct 78180
tggattacag tgtcacaatc atttcacagg attgagctac ttaaagatat gatacgccaa 78240
cttcttggcc ccagttctct ggatcaactc ttgcaagaat tgcaagggaa ggtggtggtg 78300
caagtacatc atctttctga gtacctgata gaagagctca aggagaagag gtactttgtt 78360
gttctagatg atctatggat tttacatgat tggaattgga taaatgaaat tgcatttcct 78420
aagaacaata agaagggcag tcgaatagta ataaccactc ggaatgttga tcttgcggag 78480
aagtgtgcca cagcctcact ggtgtaccac cttgatttct tgcagatgaa cgatgccata 78540
acattgctac tgagaaaaac aaataaaaat catgaagaca tggaatcaaa taaaaatatg 78600
caaaagatgg ttgaacgaat tgtaaataaa tgtggtcgtc taccattagc aatacttaca 78660
ataggagctg tgcttgcaac taaacaggtg tcagaatggg agaaattcta tgaacacctt 78720
ccttcagaac tagaaataaa cccaagcctg gaagctttga ggagaatggt gaccctaggt 78780
tacaaccacc taccatccca tttgaaacca tgctttttgt atctaagtat ctttcctgag 78840
gattttgaaa tcaaaaggaa tcgtctagta ggtagatgga tagcagaagg gtttgttaga 78900
ccaaaggttg ggatgacgac taaggatgtc ggagaaagtt actttaatga gctaatcaac 78960
cgaagtatga ttcaacgatc aagagtgggc atagcaggaa aaattaagac ttgtcgaatt 79020
catgatatca tccgtgatat cacagtttca atctcgagac aggaaaattt tgtattatta 79080
ccaatgggag atggctctga tttagttcag gaaaacactc gccacatagc attccatggg 79140
agtatgtcct gcaaaactgg attggattgg agcattattc gatcattagc tatttttggt 79200
gacagaccca agagtctagc acatgcagtt tgtccagatc aattgaggat gttacgggtc 79260
ttggatcttg aagatgtgac attcttaatc actcaaaaag atttcgaccg tattgcattg 79320
ttgtgccact tgaaatactt gagtattgga tattcgtcat ccatatattc acttcccaga 79380
tccattggta aactacaggg cctacaaact ttgaacatgc cgagcacata cattgcagca 79440
ctaccaagtg agatcagtaa actccaatgt ctgcatactc ttcgttgtat aggacagttt 79500
cattatgaca actttagtct aaaccaccca atgaagtgca taactaacac aatatgcctg 79560
cctaaagtat tcacaccttt agttagtcgc gatgatcgtg caaaacaaat tgctgaattg 79620
cacatggcca ccaaaagttg ctggtctgaa tcaatcggtg tgaaggtacc caaaggaata 79680
ggtaagttgc gagacttgca ggttctagag tatgtagata tcaggcggac cagtagtaga 79740
gcaatcaaag agctggggca gttaagcaag ctgaggaaat taggtgtgac aacaaacggg 79800
tcgacaaagg aaaaatgtaa gatactttat gcagccattg agaagctctc ttccctccaa 79860
tctctccatg tggatgctgc aggaatctca gatggtggaa cacttgagtg cctagattct 79920
atttcatctc ctcctcccct actgaggaca ctcgtgttgg atggaattct tgaggagatg 79980
cctaactgga ttgagcagct cactcacctg aagaagatct acttattgag gagcaaacta 80040
aaggaaggta aaaccatgct gatacttggg gcactgccca acctcatggt ccttcatctt 80100
tatcggaatg cttaccttgg ggagaagcta gtattcaaaa caggagcatt cccaaatctt 80160
agaacacttt ggatttatga attggatcag ctaagagaga tcagatttga ggacggcagc 80220
tcacccctgt tggaaaagat agaaataggc gagtgcaggt tggaatctgg gattactggt 80280
atcattcacc ttccaaagct caaggagatt ccaattagat acggaagtaa agtggctggg 80340
cttggtcagc tggagggaga agtgaacgca cacccaaatc gccccgtgct gctaatgtac 80400
agtgaccgaa ggtatcacga cctgggggct gaagccgaag gatcttctat agaagtgcaa 80460
acagcagatc ctgttcctga tgccgaagga tcagtcactg tagcagtgga agcaacggat 80520
ccccttcccg agcaggaggg agagagctcg cagtcgcagg tgatcacgtt gacgacgaat 80580
gataggtcag tcactcccta catggcagct taattaactt gtttctaatt ctcttcttgt 80640
tcagtattag ccatcaggtg agggcgatga tttcaactca cttttcatct ctctcgtttt 80700
cttaacctga cagcgaagag ataggcacag ctcaagctgg ctgacgatct cctcccccat 80760
cagcgtcgtc atcagcgaac agaaagggca gagcttccct gcttctgcgt gcacctcacc 80820
gctctgactc ggagggacat gatgatcaat gaggcttcca gtttccaaat gtgtggctaa 80880
cacaccaggt tgtccctatc cgaggtatga attgatgatc caattttttt ccttccggtg 80940
aggttcaaac atttgatgct tagtttcatg agggtattct gtgtttcggg ttgtgatatg 81000
cacaattact cccagtttat gctttgatgc tgagttttta tttctcttct tacacgtgca 81060
ctcttcattt ccatttcatt caaaacagaa accaagttga ttgcattgtg gaggggaata 81120
tgagatcaga aatcaaatgg ttagttgtgg ttttcttatt tcgtttgcta tgcgcagttg 81180
cgcaccaacc gtttgctaga atgtctgaaa gagcctatgt acatatggtg gcctgaacat 81240
tacaagttat catattttat attgttgcta gctttccttt caaaaaaaaa aaaaattgtt 81300
cctaaccgat cacatagtcc agtagtccag tagtaagatt tttgttaagt ttattgttac 81360
tgaatatatt gtttggcctg cagttgttat ttctctcaaa acaaaattat ttggtagtct 81420
caagtacaaa aagaaagaca gatcagacaa gttgttttac tctactagtt tcaaattgat 81480
catctctgtt tgttcttcat tcattttctt tctgtaagag agtttgctag gatggtgatg 81540
tggtcatgtg gatgatcaaa tggactacat cagacgcatc acactgctgc ccaaccttta 81600
cccactgtag acaaatggag tgcaggtcct aaaccaggcc agaagtttgt tcagtgttct 81660
tgttccaaaa taaacattct ggatggcagg ttatttcatt ataacattca ctcttatagc 81720
ttgcttagtc aaaactacaa ataaggtctc ctaaaaaaat gcatcgacgt tgatatctgt 81780
gttttctgcc atgcagaatg acttgctctc aatggttgaa gctgcaatct tccaggctca 81840
tttctggctg aacccaaatt ggtggcttgg aggctggagc tgcatgacat cagagataac 81900
aatggccact ttttgttgcc atgggtgagg gtacatggat catgccgcta agcctttact 81960
ccgagctagc agaaaactgg ctggctgtag atcgagttcg ccatcgccct caactttgtc 82020
gatgcgatgg cgatcatgga tagatgtatg tatgtaaaaa cacaaatttt agtgattaca 82080
gaacttattt ttctctttaa tcagattatt aatcagtggg atttttcttt ctctagtact 82140
gtataaaaat acttttttat cgtcaatcct cctaaaattc ctatttataa actcattttt 82200
cttcagtttt tttttctgta ttttggtttt ctttcctcta cgtgactaca cattttgaat 82260
tgaacatgct ctgtatctgc tcggaatact tattattcag ccaacttaaa tgcatgagat 82320
ttgctccggt tcaccaaaaa ttacctcgag gtaccagtac ctcatggtat caaattgttt 82380
ccgatcgtga aataattttg taccgttagg taccgtatct cgagatctaa atgcataggg 82440
gcatttggaa tatgcactta acagttgttt gaacacttcc aaggaatatc tcctcagttg 82500
tcggacgact cattcatttt catcgcttcc aacaataatc aactgtgtct cttcctctcc 82560
ccccaatgct ccccctagat ccggccctac cgccgctaga gctgaccagc gtctatgcgg 82620
cggttaggac agtggcagcg gggaggtggg aggtggaggc gctgcggtgg cggccagagg 82680
cagccgggcc cgcacgctga ccttccaggt tggtgatggt tggaggtggt cgggaggacg 82740
gcaggtagcg gctatgcgtc agcgatggag gaccttcgga caacggtggg gacggcggcg 82800
gcctaggacg acaacgactc tcgtcggcgc tggcggccct aggggctccg gtggaggaca 82860
acggctattc acgtcggcgc cagtggccct gggggcattg gcggctcccg tcggccagcg 82920
gcccaggatg tcagcggttc tcgttggtgc cggtggccct aggggctgcg gcggaggacg 82980
gcagcggttc acgtcggcac tggcggccct aggggtagcg gtgccccagg acagcggcag 83040
ctcccgtcgg cgccggcggc cctaggggta gcagcggagg acggtggcgg ttcccgtcgg 83100
cgttggtgac ctgggacggc ggcggtctga gcactatgga taatggaggc ctagaaattt 83160
ggcaaagtgg aagctaaccc cgtcggttcg tgtttggttg gctagttcta actgaacgat 83220
gaacgacgac ggttgaaaat gtgctaactg gcggcgtgag tcaactcacc taaaacggat 83280
aaagatggca ccaacagagg tttgcatgga cagtgcacta ggggcgatga agaatacaca 83340
acttccactc gtcaaacttg gctgtttcat gagaatatgg cgggaagcag agaagctggg 83400
atgtgtcgag gtcgtttggt tttcttttat tttttggttg tgtgttctcc tccttgttga 83460
ggtgtgagtc taagtgctct tgtatccttt tggctgtgta tatccttcgt ggatatagag 83520
gccagattaa tgaaaatcca ttattaaaaa aagttgttgg tcggctaatt aaacctgatt 83580
aagaattcca tgtgcaggga catgtactag cgttcccaaa tcttagaaca ctttggcttt 83640
acaatttgga tcagctaaga gaaatcagat ttgaggacgt cagttcaccc cagttggaaa 83700
agatagaact ctcttggtga aggttggaat cagggattat tggtatcatt caccttccaa 83760
agctcaagga aatttcactt gaatacagaa gtaaagtagc taggcttggt cagctggagg 83820
gagaagtggg cgcacatcca aagcatccag tgctgcaaat gatggaggat cgaagctatc 83880
gcgacctagg aggtgatgcc gaagtatctg ctgtacaagt gcaagcagga tcccctccct 83940
gagcaagagg gagagagcac gcaggtgatc acgttgacga caaactacag gtcagtcact 84000
ccctacatgg cagcttaatt agctagtttt ctcttcttat tcagtattag ccgtcaggtg 84060
atatcgatga tttcaactca cctttcatct ctctcctttc cttaacccaa cagtgaacag 84120
ataggcacag ctcaagctgg tttgatcaag tgatcatctc ctcctccatt ggcatctcgg 84180
gtcgtccctg gctccctgct tctgcggctc cgagcagggg tgctgatcta aggaggcgtc 84240
cacttttttc aattgcgtct caggtatgaa ttgttcgatc tgatcttttc tcgtgatatg 84300
ttactgttcc agcatgagta tttcaaccag cggcttagaa tttttcgttt gatcaggttt 84360
tttccccttc ttacctgggc actatacttt tggttttctt atttcatttt tgctgtgcac 84420
accaggtgtt tgctagaatg tctgaaagag cttgtgttca tggttagctc aacattatgt 84480
gttagtcata ttttatatcg ttgctgacct atcacatagc gcaggagttt tttgctatgt 84540
ttattgttgc ttgctgttga ttttcctttt tgtaaagaat attagctttt tagataacga 84600
aaagaatatt acgtatcctg caaaaaggat tgatttggtc gtcactggct agtaggggtg 84660
aaaacggtac ggaaactttc cggattccgg acctattttt agaaacggaa tctgtcggtc 84720
ggaatttttt tggaattttt cggaaacgga aacgaattcg gaaatatttt ctcggaaacg 84780
gaattggaaa tgataagggc agtttccatc ggaactcgga atcggtcgga aactttctgg 84840
aaattttctc ggaatttccg gaaattttgt gactgaaata gtgaatacca tggtatttgg 84900
ctgttatttt ttttaaagta tttgttatgc aaatctgaag ttacataaga atattttttt 84960
cctgcattgg gatttatcaa catcagtact ctcttaaaca tagataattt atttcataga 85020
ttgtgttctg tgattgagac ttaaaaaata gacttatatg attgtgtttt atgatgaatt 85080
gttgaccgtt gagacttgag aattggattt atcagtttga ggggtttttt attccgataa 85140
atttcgttac cgtattcgtg ccgattcgtt ttcgctccgt tttcggtttc gataatattt 85200
gattccgttt tcatatccgg agtttccgat tccgattgtg aaaacaatat gaaaacgaaa 85260
acgataacgg tggtttttgt ccgtttccat accgttttca cccttactgg ctagtacaaa 85320
acaatttgga ttgtcggagc tgctggtctt gggaaactac tcttcaaagg tggtttacaa 85380
aactctgatg ttagtaccaa gtccttgcag ggagagatat agaagagtgg gaaattttgt 85440
atgctcaact tccatcagaa cttggatgca acccaagcct tgcagcaatg aagaaggtgg 85500
tagcccttag ttacaattac ttgccttctc atgttaagcc ttgctttcta tacctttgca 85560
tctttcctga ggattttgat atccaaagga agcgcctagt tcatagatgg attgcagagg 85620
gatttgttag agctaagggt ggagtgagaa ttgttgatgt gacagagaaa tattttaatg 85680
agttgattga ctgaagtatg attcaagcat ctagagtgaa catagaaggt actattaaga 85740
gctgccgagt ccatgatatc atgcatggtg taatgatatc aatatcggaa gaaaattttg 85800
tatatctgat gagggatgat ggaactagtg tagtggagga aaaatattcg ccatgtagcg 85860
taccatgaca gcaagtgttc tattataggc atggactgga gccatgtacg gtcgttaact 85920
ttgtttggcg atgagagacc caaagagctc tcacctccat tctgttctcc ccaattgaaa 85980
atgctaaggg tgctggatct actagatatt atatttggac tagcaaaaag atatggataa 86040
aatatggttg ttgcgtcact tgaaatatgt caatattagg tgttccaatg aatgctcaag 86100
catttatgca cttcctagtt ccataagaaa attacaagag ttacacactg gacatatctg 86160
acacttatat tacaatgcta ccaaatgaga ttagtaaatt gcagtctatg tgtcctccgt 86220
ggtagaagac aaggatccta ctatgacctt gatacatata atcgtaagga atgtgtactt 86280
attttatcac gtattccttt gattatggct ttaagtgatt ctgataacca tagaagacta 86340
attaccgatc tacacacggg ttgttcaagt cattggcata taattaaaga tggtgcaagg 86400
gtaccaagtg gaatcaagaa tttgaagaga ttgaaagtac tagagatagt ggatatcgcg 86460
gtaactgaca gcagagcaat tcaagagttg ggggaactta accagctaag aaaactaagt 86520
gtcatgacaa aagggtcgaa caagaaaaag tgcaaaatac tttgtgcagc catcgaaaag 86580
ctcacttcct tcaaatctct ctatgtggat ggtcatggat actcacttga tggaacactt 86640
gagtggcttg attctatttc ccatcctcct tccctcaaga gccttagatt gaaggggtgt 86700
attaaggaga cacccaactg gtttagggag ctcaaacact tggtgaagat ttacttatat 86760
aaaagtcgcc taaatggaga taccatggag atactcgggg aactacataa tctcatggat 86820
cttcactttc gttggtatgc atacgttggg gagaagctag tgttcattga gggagcattc 86880
caaaatctcc ggaagcttgt tgttgaaact gaggataaac taagagaggt gaggtttgag 86940
gagggcacct caccccagat ggaatggata gaaatctgtc attgcgaact gatatcaggg 87000
attgttggtg tcaagcacct tccaaggctc aaggagatag gactcaaatc tgctaaagtg 87060
gcaaggcttg gtcagctgga gggtgaagtg gacacacacc ccaatcagcc catattgcgc 87120
ctgtctgaga agcgaagcta tcacgatctg ggggaaaccc atgtatctgc tgttgaggtg 87180
gaagtggcgg atgagcccct tgctcaccag cagcctgtgg acgttgacga tcgaacaaca 87240
accggtcagt cctgcattat gacattcatg cagctacttg ttttgttttt ctcttttgtt 87300
cagcattagc ttagcttatc tcattttctt acctttttcc ttcttccttg ttgtctctag 87360
caaaacccaa cagttagcga agaatgctcg atggtgctga tctcgcctct agatggtgat 87420
gatgatcagc tccccgttgt gagctctcct ggctgcctgt agtgctgatc ccggagtccc 87480
ctgctgcatt ttccacctcc cgtgttgagg tcagttcagt atctccccta agtcaccatg 87540
ccggtatttg tttgtttcta tatgatttga ttagtaggat gctttttgtt tttgaaattt 87600
tgtatcatga ttggttggag cgtgtgatta ggtttcttac agttgcagca gaggtcgtat 87660
tttgttttaa tgtgcacacc agatgttcgt ccaaatgtct tgtcaaaatt tttttatctt 87720
ttgatttgtc aagtatttat gattcgcaat atgaaacatc gttggtcagg atctgtgctg 87780
cacgtatcga tgcaatgtaa tgatccaagt gacggttccg tttgttcgtt atcttcttat 87840
caatttaggc cctgtttttt tcagcttgga atttttataa tctagattat tgagtcagat 87900
tactataaac tagattgtta taatctgtag tagaataagc ggttagttgt ttctttccta 87960
gattattaga gcctagatta ttgggtttac aagtctaaag agggactggg gtggcatggt 88020
gggtaatttt tcactcaata atccggaaaa agctcaccta aatgagctta tcagattaga 88080
ataagctggg ttccagatta taataagcta cttcaataag ttatctgttt ctttcagctt 88140
actcccaata atctggatta taataatccc aagctgaaag aaacagggtc ttagtgttcc 88200
gtaccagatt ttcaaaaagg aactaatatt tcttaccaac catttatgat gtaatctctc 88260
tatccactgt cataccgtgt tacctgtaga ctgtagtctg tagacataaa aaaaaagtac 88320
ctttttggtc tctgaaacat ttacctgtat ctatcgactg gtctccaata tatccttttg 88380
ttttcgttca atttgaaacg gccttctttt tgccaatcca ttaaagaact ggtttgcgaa 88440
tgtttagttt gagagtagct tgaccaaatg ggccttaagc ctgattgcag tggattttac 88500
ttgctcaggg taaaaccaaa ttaaaggatc atgttcattc tcaggaatct ctagcatgga 88560
atgagaacaa aaatcataac aatggtcaag gtaacaagac tgaaccaacc accatggcgc 88620
taatcatcga tctgaaataa catcggaact tgaaagcttc agaacgtcca tcgtatattc 88680
gtcagtgcgt gcaaactctg aagtctgaac tgcgaagtag tcatcaaggt cgtagtctcg 88740
tagatatgat gttcgttacc aatacctgtt tctaatcgat tcctttatgt ttttccgttc 88800
attttctctc agttttatgg aacactattc agctggggac tagatgtgga acggagtaca 88860
ttagacgcac gaatgcatgc attgatgcat agaatacggg tcttggaggg atacgcgtag 88920
gctacgatag cataaattaa aattttctac cgcgtaaact aagaaccata caaatattag 88980
atcatagatc gttaccactc gacgcgctgc gcagtggaag aaagcgctaa aaaggcgaag 89040
gaaccctcgc gatatagcgc gcatcgatgt tgaagaagta gtcgatcgta ccggctcgac 89100
cttctcctcc tcgtgcgttc tcctcgccgt actcccatgc cgatcagtac cgcaaagcag 89160
tggcgcctct accggtatcc acacgtacag ggacggaacg ccatgtgcag atgtgctagc 89220
acctgcgcac ggctagggtt ttgctcgggg aagggagtgg cggctagggt ttctcacgtg 89280
atgcaatgtc tccgccggtc acacccctca cgaatatata ggatccatga ctcgggcctc 89340
caaggcccgt gggactccta ttcggatccc tatccgaatt aagctcatac tggatctcca 89400
tccaatcccc ttattccggc ccattaagtg tgcggccctg taggttcatg cacactcggc 89460
tgtaacccga aaactctttt tggtccacgt gtcaacagtg gcccctagca gaacgtattg 89520
accgaccggg catatacaaa catcatatcg gttgaacctc tagtgtatac ttgtatgaac 89580
ctctttgcct cacgagatcg attaagctca aggctagata tgtgccatcc tctaatagct 89640
caatcattca ctcgaacctg tgatagatta cataactcat gattgtcctc aaccaccttt 89700
ggcatggcca tgcattttca taatctataa catcgaggga cccagagata tctctccata 89760
aaaggggcaa atcccatctt gattattcat atctcactac acgtttcata gcatacccga 89820
aaactacttt tataactacc caattacgga gtagcattta gcagtcccta agtaagctac 89880
tacacatgtt gagaaccatg ataatctcag gtctaaggat tcaacaccaa cactaaatga 89940
gatcactgat gacacaacac atatgtctct tgcagtgtct catgttgggt ctatccaaca 90000
atatgtttcc caacatgtgt ccacattatt aatttggtat ctctatacca taatccataa 90060
gacatgatca tcaattaata catgtgctga tcattaaaca tatttgtttc acatatgata 90120
tttgatcagg gatcttttag aaatagcaac atacaacata aagagtctca taaaagaatc 90180
acatattcag taaccaataa tgagttatct attttaagga acaatgtcgg ataaatatgt 90240
aaacataata tatgatacaa tcatctctat tattgcctct aggacatatc accaacaggt 90300
ctgcaatgca gtgatgatga cacctgtgca aaatatttca gtcagggaac tcaggatcac 90360
taaaagatgt cgatgttgcc tctctggaat gtatgacatc tcacttctca ggaaggattg 90420
gagccggtgc cgccatcaga aatcacaacg gccagatttc tgtgtcattg agatgctata 90480
tgtatcggaa gacttcagat aaaaaaatat cttctcatct ccaggttact gaacaacgga 90540
gagtcattct actcctatat gctactttta actttcacta gctagtctgt atgattgatt 90600
tgtttccttt tttttttttg cacttacatt tgttaatgta tatgtgtgta tatattagga 90660
tagagggccc attttggaca tgtatatgtg tactgttgaa ctaatgttga ccagaatatc 90720
tgaaattccc caacattatg aattgcgctg gatctagatc accacgagaa gctaagccgg 90780
ttgtgttggc gggattggtc gcttcaaaaa ctagatgata ccccgcgcgt tgctgcggga 90840
ttttgtaggt agaaatggag agctacacgt ggaggcataa gagataaatg taatagtagc 90900
cattggaaat ggtaattttt ttcaaacaaa caactatttc tgtaggatga aatctataaa 90960
ctggagtagc aacatccgtg aaggttaaga tagcatttct cagatatagt aatagcaacg 91020
caagagatac taattttgat tattggtatt gaccttctct tcagttagac tgcatttgag 91080
gtaatccatt ttttatgtaa gaaatgttag aagcatatga gggtcagaga tagcttcagt 91140
ttgttgaggt tatagaagaa tccatttgag caactgcatc catgttcact tgtgaagaac 91200
agacaaatga aaaatgagca acatctcgtt tgaaagtttg aggattcctg aagggaagag 91260
caataaatgg caaagtatag acaatacgac gatgcaaaag aagctagaag cagttagcat 91320
gacaacaaag aacgcatacg gttaacatga caacagagaa tgcaaggtac caggaaggca 91380
ggaatagagt aatagagaaa ataatgtaat aggagtaaca tttattaatt ggtgattaat 91440
gataacctgc tggttggttc ttgttgaata tccatgtgtt ggaataagaa taaagctgtt 91500
gagaatagga gaaatgaaag ggagttgtca taaggagaaa cataatggtg tatgtgatac 91560
ttatagaggt tgagtagtaa tgtggtatcg aatcgtgccc aattgttcat cacagaataa 91620
taatcaaaac cacctttgat tttacaaaaa taatatctga tttattgtta actgcttatt 91680
gaattagcat taaacagtac aatcagagta gctaattgaa tcgtggaggg tgtggccctt 91740
tgcctaactt tttatgcacg tttatgcatt tttattaatt tattgaatca acatagtgca 91800
acccctatct atccctttac cataaagtaa attcaaagaa aaaaaacaat gtttatcttc 91860
tcatgttaag tgttgttaga atgtctgaat cagaacccat cttaattttc tctgtttctt 91920
aggatatcaa tcatgtctta gagctgaaag tttgtatcaa cagaaacaca ataacttgta 91980
gtattttggg ctaaaagatc cataaaactg aagataaata gtcagatggc cttgatgaat 92040
aacccaatgt ttgacaaact gttcaatttt gctattacaa atagcattct ttatactcta 92100
gccagaaaaa aaaatgaaaa atggatataa agtaggatca tcatatacca aagaagaatc 92160
aggatagata tatcaaaaat tagggatcga tgtgtatgaa aaatagctag acagtgttgt 92220
tatggaagga ataacttgta cctcttgcga agcaagtgtc gcagtatggg catataataa 92280
tatatagaaa tcaagttacc atgaatgaat atggggcaat tatgattacc caatgtatat 92340
acagattgct ccagctgttg ctttggatgg gaatgtcatg gggactaatc tcagcggtag 92400
cccatagttg ctgatgcaac aatagtaagc aatctgctaa tggaaaacaa tctgcatccg 92460
gaattcataa ggtatatact gcgtgatgta aaattggtat acataccaat gatcctcata 92520
ccatgaattg tctcctttag tgaagtgtat atactaaata aatttcaatc cggttgaacg 92580
gagacggtag aaacctgaag tagagccgaa acaaaaccaa tccctccttt cttaattctt 92640
gaagaatatg aggaataaca taaacaagtc aatctagtgt gaccgaaagc agaagccaat 92700
ttattggatg aaaaatatat ggctcataaa gaggaagaag cataccttcg ggaggttggt 92760
gtgttcgagg tgaaggggag gttgaagatt tcaggggagg aagaaactaa gacaacaaat 92820
cgaacgacgt tttgtggtga ggagctcgac atccatgaaa tctgatcggt ttttaatgtt 92880
ggccattaag actgctcgtt ggtgggtgcc ggcagtttct gtcttttgtg atatgccgag 92940
gaggcgagca gcctaggagg tgggatggag cgaggaggtt ggggaaacgg cgcggctggt 93000
gggccagttg cgtgcgcgcg cggaggttgg ggaaggttgg ctcgacggag acacaggatc 93060
gtcggggagg gaggaggaag gagagatgcg cggctgagat gaactcgcct ctcgcgtgcg 93120
cgtaggggaa acggtccggc catgacgcgc agctggcata cccgtcgcat gcgcgcgcgc 93180
ccagggggaa cccggcgcgg cggagtcgcg gagaccgcgg ctggtgccgg taggaagcac 93240
gagcgcaaga gaccgatcga ttgccctggc tttggagtgg ataaggttcg ggaaacggaa 93300
cctagtgcct gaatgctgag agtgagattg aacctcactg gttaggtaat aggacgagta 93360
aacgagaagt caacccaaaa cattggaatt cggatacagg gtacagatgg acaatattgt 93420
taaacattgg aaagccaacc caaaacaaag ggcagatctc gaggtgtagt ggacagagac 93480
tggggaggcc cggcatccaa acccacataa cacgcctttt ttaaaaaaaa acaaaatgag 93540
gcacaaactg taaaatccac ctaacacgtg atataggcgc cagctaagtg ctaacgttag 93600
agcaggtaca atagcaggct atatgccagc tgtaaacata ttttaagaag ataaatcagg 93660
agagagaaga gcagcgggct acagatttgt agccagctgt agcacgaact ccaagacgcg 93720
gtgtgtctat gacaggtggg gctaggtatt aatagtgtag tatgtaacta tagtatgaat 93780
gagctattag attggctata gatgaattag agctagtagt tggctatact attgaacttg 93840
ctcttagggg aatatggttg tccccctgtg cgttagtgcg tacagtgatg tgaactacta 93900
taagagcagg tacaatagtg gactattagc cagttgtaaa tatattttaa tgagataaaa 93960
gatgagagag aagagtagct ggctacagat ctgtagccag ctgcagaacg gactccaaga 94020
cgtaatgtgt gtatgacagg tgggaccata tattaatagt atagtaagca actattgtat 94080
aaattggcta ttagattggc tatagattaa ttggagctag taatgggctg tactattaaa 94140
cttgctctaa tgataatcct ctctgcttga attgttcagt gtaaaagcta gctacaaatt 94200
ctgattgcag agccagaaga gccagtcgca ttgtcctatc tcctttgcgg ttgtgagctg 94260
cttgctgttc tgagcgtgaa ccgtgaaggg agatctagtc gaggagagtc gatggcggag 94320
acggtgctga gcatggcgag gtcgctggtg gggagcgcca tcagcaaggc cgcctccgcc 94380
gctgccgacg agaccagcct cctgctcggc gtcgagaaag acatctggta cgtaatatgt 94440
actgtggctc tcgtttattc tgtactagct tactgatcag catttattgt atcgacatcc 94500
ttcttagcct cgattttgtt ggccatcaat cctgatcgga acaaatcact aagtcaagca 94560
aatcaattga tgagtgcaca aacttttttt ttttgcatga ccaatcttga gttcttgagg 94620
ggcgaaacag acgcacccga ccgcagtcac cctctccctc ctcccacagt cccactcctc 94680
ccctccgcct tgccgctacc cgagcgaccg ccggaaagcc aagtggctgc aaggacggtg 94740
gcggtggggc atgctctctc tctctcggcg ctgcaaagga gggggcaccg tcgcatctag 94800
gatggcaaag gcgtctccac gccagtcaga tccggtgagt ggctggcaga aaacgaggcg 94860
gaatagcgga gggccgagcc agtgcttggt gtggctagca acatgggagg ctagcgatgc 94920
ggtagcaagc agtggtggta actacaaatc tatagctccc ttgccagatc tgacgacccc 94980
gcaaccggat ctggcgatgg cccaacggtg tcggaggcta cgcatccgag aatgttttgg 95040
taaggcgacg gcacaatcgt gcgacgaccg gtaatccatg ggggtgagga ggcaacaagg 95100
tgcaaccaag gaagcaccgt gacatgccga ggaggatgcg gcggctcgcc atgagtggat 95160
ctggaagcga cagatgtagc tagatttggt gggcggggtc gcagcagcaa catgtgccgc 95220
cgatgcgatg tggcagtggc tgcttgagat gccagatggg gcccatgtga tggaggccag 95280
aggagcagcc agtgggccga cggggaggat gcaaggtgtg gtgggctgca gcgacggctc 95340
ggtgcgagca agagcgacgt ctgtgcatgc tgggacatcc tagcggggcg gcgtgatggt 95400
aggaggtcgg cagaaaaaat agcgtgccac ggaaggtggg gccatggctg gtcggcggtg 95460
gggcatcggc gcagcgaacc cacaggctag cggaggctgt tggggtggtg gaacgcaggg 95520
gtggtgatga cagggaaggg tgaaaatcta gctcggtgtt tcatcgggcc ggcaacgatg 95580
acacgttcaa gcgccgtctt ccccctttgg ggcgttgtcg agctatgacc ctctccctcc 95640
tcacaggact ctccagatga aaacctagtc catttagatg ggtcatggcg gcaaccttgg 95700
catcatgatc ttcttggagg cattgtccag gaggtcttgt ttcctcacct tgcaatgccc 95760
cgatcatttt tgtctttggg attctttcag tcgttgtcat cgggttaccg tgagggacaa 95820
gtggattgtc ttgtctctct cgccctctca ctcctcaacc cttctacgtg ataatgattg 95880
ggagcccgtt gatgaccttc tatttggatc tagtgctcgg tggggccttt gcaacctagt 95940
gtaggactag cggtgatcgg tcacgcatag aggcggtcgg ttcggtgcta gtgcttctct 96000
tggggtatgt aaggagtcgc tagaatgtgg tggtgtgctt tttatttttc ctttccctga 96060
ttataacctt ctagggctgt aattttgttt ttttttcttg ctatattaat atgaaacttc 96120
acactgcctt gtgcggctcg tttaaaaaaa aaacttgagt tcttgacact ataagtatgt 96180
tagtagtgga gtcgacatta gtttatctaa aacatctctt catatatatg aaggccacta 96240
atgatttttc tttcctaggg aaccaaagtt ccgcggtatg ttaatccaca aatccccttg 96300
taagatatcc tatggcaaat gaactaaagg catgtacaat gataataatt aataggagaa 96360
tcttaacatt tctaattagt tctaattagg aatattaact gatatggaag agagagagag 96420
agaaagagga gagatagaac attgttgtta tggttaacaa tggctcagca actacttgcc 96480
tctttaaaat ggaaacttgg ttgcgagggt gaaaaaaagg aaagaatatt agtaaagaat 96540
atattttttg tttagtagtt aaaatatttg ttgtctcaat tgtttaaggg cacactctaa 96600
ataattttgt gttatctaag agtccatacc atgcagagga cccgcgtttt ccacgtggac 96660
aaccagagca gtaacaaacc ctagcgcctc caccccctta gatgggctgt ggcggcgctt 96720
tcggcattgc gttttctttg gaagtatcat ttagaaaatc ctattattgc ctagcctgcc 96780
ttaaggaagt tcaggcgaca cccttggatg gcgatgtccg agagcccgtg gatgtttagt 96840
tgtttagaca tggtgttgga cggtcgaatg gtgggcctgt tgtaggtatg gtggcatctg 96900
gcaaccagtc atgcttagca atagattcct atgcagaaga cattcgcaat caatcagctc 96960
gaaatgtgga tgaagctgag cttgttgggt tttctgactc caagaaaagg ctgcttgaaa 97020
tgatcgatac caatgctaat gatggtccgg ccaaggtaat ctgtgttgtt gggatgggtg 97080
gtttaggcaa gacagctctt tcgaggaaga tctttgaaag cgaagaagac attaggaaga 97140
acttcccttg caatgcttgg attacagtgt cacaatcatt tcacaggatt gagctactta 97200
aagatatgat acgccaactt cttggcccca gttctctgga tcaactcttg caagaattgc 97260
aagggaaggt ggtggtgcaa gtacatcatc tttctgagta cctgatagaa gagctcaagg 97320
agaagaggta ctttgttgtt ctagatgatc tatggatttt acatgattgg aattggataa 97380
atgaaattgc atttcctaag aacaataaga agggcagtca aatagtaata accacttgga 97440
atgttgatct tgcggagaag tgtgccacag cctcactggt gtaccacctt gatttcttgc 97500
agatgaacga tgccataaca ttgctactga gaaaaacaaa taaaaatcat gaagacatgg 97560
aatcaaataa aaatatgcaa aagatggttg aacgaattgt aaataaatgt ggtcgtctac 97620
cattagcaat acttacaata ggagctgtgc ttgcaactaa acaggtgtca gaatgggaga 97680
aattctatga acaccttcct tcagaactag aaataaaccc aagcctggaa gctttgagga 97740
gaatggtgac cctaggttac aaccacctac catcccatct gaaaccatgc tttttgtatc 97800
taagtatctt tcctgaggat tttgaaatca aaaggaatcg tctagtaggt agatggatag 97860
cagaagggtt tgttagacca aaggttggga tgacgactaa ggatgtcgga gaaagttact 97920
ttaatgagct aatcaaccga agtatgattc aacgatcaag agtgggcata gcaggaaaaa 97980
ttaagacttg tcgaattcat gatatcatcc gtgatatcac agtttcaatc tcgagacagg 98040
aaaattttgt attgttacca atgggagatg gctctgattt agttcaggaa aacactcgcc 98100
acatagcatt ccatgggagt atgtcctgca aaacaggatt ggattggagc attattcgat 98160
cattagctat ttttggtgac agacccaaga gtctagcaca tgcagtttgt ccagatcaat 98220
tgaggatgtt acgggtcttg gatcttgaag atgtgacatt cttaatcact caaaaagatt 98280
tcgaccgtat tgcattgttg tgccacttga aatacttgag tattggatat tcgtcatcca 98340
tatattcact tcccagatcc attggtaaac tacagggcct acaaactttg aacatgccga 98400
gcacatacat tgcagcacta ccaagtgaga tcagtaaact ccaatgtctg catactcttc 98460
gttgtagtag aaagtttgtt tctgacaact ttagtctaaa ccacccaatg aagtgcataa 98520
ctaacacaat atgcctgcctaaagtattca cacctttagt  tagtcgcgat gatcgtgcaa 98580
tacaaattgc tgaattgcac atggccacca aaagttgctg gtataaatca ttcggtgtga 98640
aggtacccaa aggaataggt aagttgcgag acttacaggt tctagagtat gtagatatca 98700
ggcggaccag tagtagagca atcaaagagc tggggcagtt aagcaagctg aggaaattag 98760
gtgtgatgac aaatggctcg acaaaggaaa aatgtaagat actttgtgca gccattgaga 98820
agctctcttc cctccaatat ctctatgtga atgctgcagg aatctcagat ggtggaacac 98880
ttgagtgcct agattctatt tcctctcctc ctcccctact gaggacactc gtgttgtatg 98940
gaagtcttga agagatgcct aactggattg agcagctcac tcacctgaag aagatctact 99000
tattgaggag caaactaaag gaaggtaaaa ccatgctgat acttggggca ttgcccaacc 99060
tcatggtcct tgatctttat cggaaagctt                                  99090
<210>14
<211>1214
<212>DNA
<213>Oryza minuta
<220>
<221>misc_feature
<222>806,835,891,906,946,964,970,991,997,1018,1060,
1091,1125,1129,1131,1148
<223>n=A,T,C or G
<400>14
gatttgagga cggcagctca cccctgttgg aaaagataga aataggcgag tgcaggttgg 60
aatctgggat tactggtatc attcaccttc caaagctcaa ggagattcca attagatacg 120
gaagtaaagt ggctgggctt ggtcagctgg agggagaagt gaacgcacac ccaaatcgcc 180
ccgtgctgct aatgtacagt gaccgaaggt atcacgacct gggggctgaa gccgaaggat 240
cttctataga agtgcaaaca gcagatcctg ttcctgatgc cgaaggatca gtcactgtag 300
cagtggaagc aacggatccc cttcccgagc aggagggaga gagctcgcag tcgcaggtga 360
tcacgttgac gacgaatgat agcgaagaga taggcacagc tcaagctggc tgacgatctc 420
ctcccccatc agcgtcgtca tcagcgagca gaaagggcag agcttccctg cttctgcgtg 480
cacctcaccg ctctgactcg gagggacatg atgatcaatg aggcttccag tttccaaatg 540
tgtggctaac acaccaggtt gtccctatcc gagaaaccaa gttgattgca ttgtggaggg 600
gaatatgaga tcagaaatca aatgagagtt tgctaggatg gtgatgtggt catgtggatg 660
atcaaatgga ctacatcaga cgcatcacac tgctgcccaa cctttaccca ctgtagacaa 720
atggagtgca ggtcctaaac caggccagaa gtttgttcag tgttcttgtt ccaaaataaa 780
cattctggat ggcaaaatga cttgtnttaa tggttgaagc tgcaattttc caggntcatt 840
tttggctgaa cccaaattgg tggcttggag gctggagctg catgacatca nagataacaa 900
tggccncttt ttgttgccat gggtgagggt acatggatca tgccgntaag cctttactcc 960
gagntagcan aaaactggct ggctgtagat ngagttngcc atcgccctca actttgtnga 1020
tgcgatggcg atcatggata gatgtatgta cgtaaaaacn caaattttag tgattacaga 1080
acttattttt ntctttaatc agattattaa tcagtgggat ttttntttnt ntagtactgt 1140
ataaaaanac ttttttatcg tcaatcctcc taaaattcct atttgaaaaa aaaaaaaaaa 1200
aaaaaaaaaa aaaa                                                   1214
<210>15
<211>2422
<212>DNA
<213>Oryza minuta
<220>
<221>misc_feature
<222>2014,2043,2099,2114,2154,2172,2178,2199,2205,2226,
2268,2299,2333,2337,2339,2356
<223>n=A,T,C or G
<400>15
aggaaaaatt aagacttgtc gaattcatga tatcatccgt gatatcacag tttcaatctc 60
gagacaggaa aattttgtat tattaccaat gggagatggc tctgatttag ttcaggaaaa 120
cactcgccac atagcattcc atgggagtat gtcctgcaaa actggattgg attggagcat 180
tattcgatca ttagctattt ttggtgacag acccaagagt ctagcacatg cagtttgtcc 240
agatcaattg aggatgttac gggtcttgga tcttgaagat gtgacattct taatcactca 300
aaaagatttc gaccgtattg cattgttgtg ccacttgaaa tacttgagta ttggatattc 360
gtcatccata tattcacttc ccagatccat tggtaaacta cagggcctac aaactttgaa 420
catgccgagc acatacattg cagcactacc aagtgagatc agtaaactcc aatgtctgca 480
tactcttcgt tgtataggac agtttcatta tgacaacttt agtctaaacc acccaatgaa 540
gtgcataact aacacaatat gcctgcctaa agtattcaca cctttagtta gtcgcgatga 600
tcgtgcaaaa caaattgctg aattgcacat ggccaccaaa agttgctggt ctgaatcaat 660
cggtgtgaag gtacccaaag gaataggtaa gttgcgagac ttgcaggttc tagagtatgt 720
agatatcagg cggaccagta gtagagcaat caaagagctg gggcagttaa gcaagctgag 780
gaaattaggt gtgacaacaa acgggtcgac aaaggaaaaa tgtaagatac tttatgcagc 840
cattgagaag ctctcttccc tccaatctct ccatgtggat gctgcaggaa tctcagatgg 900
tggaacactt gagtgcctag attctatttc atctcctcct cccctactga ggacactcgt 960
gttggatgga attcttgagg agatgcctaa ctggattgag cagctcactc acctgaagaa 1020
gatctactta ttgaggagca aactaaagga aggtaaaacc atgctgatac ttggggcact 1080
gcccaacctc atggtccttc atctttatcg gaatgcttac cttggggaga agctagtatt 1140
caaaacagga gcattcccaa atcttagaac actttggatt tatgaattgg atcagctaag 1200
agagatcaga tttgaggacg gcagctcacc cctgttggaa aagatagaaa taggcgagtg 1260
caggttggaa tctgggatta ctggtatcat tcaccttcca aagctcaagg agattccaat 1320
tagatacgga agtaaagtgg ctgggcttgg tcagctggag ggagaagtga acgcacaccc 1380
aaatcgcccc gtgctgctaa tgtacagtga ccgaaggtat cacgacctgg gggctgaagc 1440
cgaaggatct tctatagaag tgcaaacagc agatcctgtt cctgatgccg aaggatcagt 1500
cactgtagca gtggaagcaa cggatcccct tcccgagcag gagggagaga gctcgcagtc 1560
gcaggtgatc acgttgacga cgaatgatag cgaagagata ggcacagctc aagctggctg 1620
acgatctcct cccccatcag cgtcgtcatc agcgagcaga aagggcagag cttccctgct 1680
tctgcgtgca cctcaccgct ctgactcgga gggacatgat gatcaatgag gcttccagtt 1740
tccaaatgtg tggctaacac accaggttgt ccctatccga gaaaccaagt tgattgcatt 1800
gtggagggga atatgagatc agaaatcaaa tgagagtttg ctaggatggt gatgtggtca 1860
tgtggatgat caaatggact acatcagacg catcacactg ctgcccaacc tttacccact 1920
gtagacaaat ggagtgcagg tcctaaacca ggccagaagt ttgttcagtg ttcttgttcc 1980
aaaataaaca ttctggatgg caaaatgact tgtnttaatg gttgaagctg caattttcca 2040
ggntcatttt tggctgaacc caaattggtg gcttggaggc tggagctgca tgacatcana 2100
gataacaatg gccncttttt gttgccatgg gtgagggtac atggatcatg ccgntaagcc 2160
tttactccga gntagcanaa aactggctgg ctgtagatng agttngccat cgccctcaac 2220
tttgtngatg cgatggcgat catggataga tgtatgtacg taaaaacnca aattttagtg 2280
attacagaac ttatttttnt ctttaatcag attattaatc agtgggattt ttntttntnt 2340
agtactgtat aaaaanactt ttttatcgtc aatcctccta aaattcctat ttgaaaaaaa 2400
aaaaaaaaaa aaaaaaaaaa aa                                          2422

Claims (21)

1.一种分离的核酸分子,其选自:
a)一种核酸分子,其包含SEQ ID NO:3、7、11所示的序列,或其互补序列;
b)一种核酸分子,其编码一种多肽,该多肽包含SEQ ID NO:4、8或12所示的氨基酸序列;
c)一种核酸分子,其包含一种核苷酸序列,该序列编码一种使植物具有抗病性的多肽,该序列与SEQ ID NO:3、7或11所示序列至少有95%的序列同一性;
d)一种核酸分子,其编码包含SEQ ID NO:4、8或12所示氨基酸序列的多肽的片段,其中该片段保留使植物具有抗病性的能力,并且包含SEQ ID NO:4、8或12的至少40个连续氨基酸;和
e)一种核酸分子,其编码一种使植物具有抗病性的多肽,其中该核酸分子在严格条件下可与a)或b)的序列杂交。
2.一种DNA构建体,其含有权利要求1的核苷酸序列,该序列与驱动在植物细胞中表达的启动子有效连接。
3.一种载体,其含有权利要求2的DNA构建体。
4.一种植物细胞,其具有稳定掺入其基因组内的权利要求2的DNA构建体。
5.一种植物,其具有稳定掺入其基因组内的权利要求2的DNA构建体。
6.一种在植物中产生或提高抗病性的方法,该方法包括用一种DNA构建体转化所述植物,该构建体含有与驱动编码序列在植物细胞中表达的启动子有效连接的核酸分子,以及再生稳定转化的植物,其中所述核酸分子选自:
a)一种核酸分子,其包含SEQ ID NO:3、7、11所示的序列;
b)一种核酸分子,其编码一种多肽,该多肽包含SEQ ID NO:4、8或12所示的氨基酸序列;
c)一种核酸分子,其包含一种核苷酸序列,该序列编码一种使植物具有抗病性的多肽,该序列与SEQ ID NO:3、7或11所示序列至少有95%的序列同一性;
d)一种核酸分子,其编码包含SEQ ID NO:4、8或12所示氨基酸序列的多肽的片段,其中该片段保留使植物具有抗病性的能力,并且包含SEQ ID NO:4、8或12的至少40个连续氨基酸;和
e)一种核酸分子,其编码一种使植物具有抗病性的多肽,其中该核酸分子在严格条件下可与a)或b)序列的互补物杂交。
7.权利要求6的方法,其中所述植物是双子叶植物。
8.权利要求6的方法,其中所述植物是单子叶植物。
9.权利要求8的方法,其中所述单子叶植物选自玉米、高粱、大麦、水稻和小麦。
10.权利要求6的方法,其中所述启动子是组成型启动子。
11.权利要求6的方法,其中所述启动子是诱导型启动子。
12.用DNA构建体稳定转化的一种植物,所述构建体含有与驱动编码序列在植物细胞中表达的启动子有效连接的核酸分子,其中该核酸分子选自:
a)一种核酸分子,其包含SEQ ID NO:3、7、11所示的序列,或其互补序列;
b)一种核酸分子,其编码一种多肽,该多肽包含SEQ ID NO:4、8或12所示的氨基酸序列;
c)一种核酸分子,其包含一种核苷酸序列,所述序列编码一种使植物具有抗病性的多肽,该序列与SEQ ID NO:3、7或11所示序列至少有95%的序列同一性;
d)一种核酸分子,其编码包含SEQ ID NO:4、8或12所示氨基酸序列的多肽的片段,其中该片段保留使植物具有抗病性的能力,并且包含SEQ ID NO:4、8或12的至少40个连续氨基酸;和
e)一种核酸分子,其编码一种使植物具有抗病性的多肽,其中该核酸分子在严格条件下可与a)或b)的序列杂交。
13.权利要求12的植物,其中该植物是双子叶植物。
14.权利要求12的植物,其中该植物是单子叶植物。
15.权利要求14的植物,其中所述单子叶植物选自玉米、高粱、大麦、水稻和小麦。
16.权利要求12的植物,其中所述启动子是组成型启动子。
17.权利要求12的植物,其中所述启动子是诱导型启动子。
18.权利要求12的植物的转基因种子。
19.权利要求13的植物的转基因种子。
20.权利要求14的植物的转基因种子。
21.权利要求15的植物的转基因种子。
CN 03824033 2002-09-09 2003-09-08 广谱抗性基因Pi2的克隆与表征 Pending CN1688694A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US40921602P 2002-09-09 2002-09-09
US60/409,216 2002-09-09
US60/455,713 2003-03-18
US10/656,394 2003-09-05

Publications (1)

Publication Number Publication Date
CN1688694A true CN1688694A (zh) 2005-10-26

Family

ID=35306328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03824033 Pending CN1688694A (zh) 2002-09-09 2003-09-08 广谱抗性基因Pi2的克隆与表征

Country Status (1)

Country Link
CN (1) CN1688694A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202496A (zh) * 2008-08-25 2011-09-28 联邦科学工业研究组织 抗性基因
CN102633870A (zh) * 2011-02-14 2012-08-15 中国科学院上海生命科学研究院 水稻广谱抗稻瘟病基因的克隆及分子标记
CN104004771A (zh) * 2014-06-11 2014-08-27 浙江省农业科学院 一种稻瘟病菌无毒基因AvrPi9、编码的多肽、多核苷酸及其应用
CN107435068A (zh) * 2017-07-25 2017-12-05 深圳市作物分子设计育种研究院 抗稻瘟病Pi2基因特异性分子标记的开发与应用

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202496A (zh) * 2008-08-25 2011-09-28 联邦科学工业研究组织 抗性基因
CN102202496B (zh) * 2008-08-25 2016-04-20 联邦科学工业研究组织 抗性基因
CN102633870A (zh) * 2011-02-14 2012-08-15 中国科学院上海生命科学研究院 水稻广谱抗稻瘟病基因的克隆及分子标记
CN102633870B (zh) * 2011-02-14 2014-07-16 中国科学院上海生命科学研究院 水稻广谱抗稻瘟病基因的克隆及分子标记
CN104004771A (zh) * 2014-06-11 2014-08-27 浙江省农业科学院 一种稻瘟病菌无毒基因AvrPi9、编码的多肽、多核苷酸及其应用
CN107435068A (zh) * 2017-07-25 2017-12-05 深圳市作物分子设计育种研究院 抗稻瘟病Pi2基因特异性分子标记的开发与应用

Similar Documents

Publication Publication Date Title
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
KR101662483B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101365786B (zh) 具有改良的生长特征的植物及其生产方法
CN101842489B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN1761753A (zh) δ-内毒素基因及其使用方法
KR101754083B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR20120126061A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101583720A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
CN1350587A (zh) 植物的获得性抗性基因
CN102027120A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101351556B (zh) 具有改良生长特性的植物及其制备方法
CN107920536A (zh) 用于控制植物有害生物的组合物和方法
KR20090027219A (ko) Nac 전사인자의 발현 조절로 향상된 수확량 관련 형질을갖는 식물 및 이의 제조 방법
CN1946284A (zh) 具有改良的生长特性的植物及其制备方法
CN101868544A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN101688214A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
CN101605902A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN1555414A (zh) 来源于植物的抗性基因
CN101040050A (zh) 具有改良生长特性的植物及其制备方法
KR101429473B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101218347A (zh) 产率增加的植物及其制备方法
CN108012523A (zh) 具有增加的种子大小的植物
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1081988

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1081988

Country of ref document: HK