CN101189341B - 用于制备抗真菌病原体的植物的多核苷酸和方法 - Google Patents

用于制备抗真菌病原体的植物的多核苷酸和方法 Download PDF

Info

Publication number
CN101189341B
CN101189341B CN200680019821.3A CN200680019821A CN101189341B CN 101189341 B CN101189341 B CN 101189341B CN 200680019821 A CN200680019821 A CN 200680019821A CN 101189341 B CN101189341 B CN 101189341B
Authority
CN
China
Prior art keywords
gene
seq
rcg1
labelling
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200680019821.3A
Other languages
English (en)
Other versions
CN101189341A (zh
Inventor
K·E·布罗格利
K·H·布特勒
M·G·布特瑞尔
A·达西尔瓦孔塞桑
T·J·弗里
J·A·豪克
J·S·雅克思
E·S·琼斯
D·S·穆尔塔尼
P·J·沃尔特斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
University of Delaware
EIDP Inc
Original Assignee
Pioneer Hi Bred International Inc
University of Delaware
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc, University of Delaware, EI Du Pont de Nemours and Co filed Critical Pioneer Hi Bred International Inc
Priority to CN201610894769.1A priority Critical patent/CN107338254B/zh
Priority claimed from PCT/US2006/012443 external-priority patent/WO2006107931A2/en
Publication of CN101189341A publication Critical patent/CN101189341A/zh
Application granted granted Critical
Publication of CN101189341B publication Critical patent/CN101189341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8282Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for fungal resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Abstract

本发明涉及编码可以赋予对植物病原体毛盘孢属的抗性的基因的多核苷酸序列,所述毛盘孢属造成玉米和其它谷类的炭疽病茎腐烂、叶斑病和顶梢枯死。还涉及携带包含所述多核苷酸序列的嵌合基因的植物和植物的种子,所述多核苷酸序列增强或赋予对植物病原体毛盘孢属的抗性,和制备所述植物和种子的方法。本发明还提供了可以用作分子标记的序列,所述分子标记又可以用于鉴别玉米系中来自新杂交的目标区域,并快速且高效地将该基因从携带所述基因的玉米系渐渗进不携带所述基因的其它玉米系中,以使它们抗毛盘孢属和抗茎腐烂。

Description

用于制备抗真菌病原体的植物的多核苷酸和方法
发明领域
本发明涉及用于生成或增强植物的病原体抗性的组合物和方法。另外,本发明涉及已经用本发明的组合物遗传转化的植物。
发明背景
禾生毛盘孢(Colletotrichum graminicola)(Ces.)(Cg)更通常地称作炭疽病,是影响玉蜀黍(Zea mays)(L.)的炭疽病叶斑病、炭疽病茎腐烂(ASR)和顶梢枯死的病原体,所述玉蜀黍也称为玉米(maize)或玉米(corn)。它是仅仅已知的也会造成叶斑病的普通茎腐烂(Bergstrom,等,(1999),Plant Disease,83:596-608,White,D.G.(1998),Compendiumof Corn Diseases,pp.1-78)。在美国,已知它从1855年开始发生,且已经在美洲、欧洲、非洲、亚洲和澳大利亚有所报道(McGee,D.C.(1988),Maize Diseases:A Reference Sourcefor Seed Technologists,APS Press,St.Paul,MN;White,(1998)同上;White,等,(1979)Proc.Annu.Corn Sorghum Res Conf(34th),1-15)。只是在美国,每年感染超过3750万英亩,全国范围内的平均产量降低6.6%(参见图1)。产量降低是由于受感染的植物的低核重量和“倒伏”,也就是说,由于感染造成茎的柔弱,植物倒下(Dodd,J.,(1980),Plant Disease,64:533-537)。倒伏植物更难以收割,且易感其它疾病。感染后,通常茎的顶部首先死亡,而茎的下部仍然是绿色的。在外表,通过茎外皮上的斑点样黑斑,可以识别感染,同时在内部,髓组织变色或呈现黑色。接种会以许多形式发生。根可以生长穿过茎碎片,且受到感染。这将变成日益严重的问题,因为“免耕(no till)”农业方法由于它们的环境益处而被更广泛采用。真菌也可以通过昆虫损伤和其它伤口感染茎(White(1998)同上)。叶感染可能先于茎感染,从而造成叶斑病,并提供茎感染的接种物。关于自然界存在的Cg不同品种或种族的数目,技术文献中尚有争论。病原体会由风或受污染的种子批传播。孢子可以存活最高达2年(McGee(1988)同上;Nicholson,等,(1980),Phytopathology,70:255-261;Warren,H.L.(1977),Phytopathology,67:160-162;Warren, 等,(1975),Phytopathology,65:620-623)。
通过使用杀真菌剂,农民可以与玉米真菌病例如炭疽病感染相斗争,但是它们具有环境副作用,且需要田地监控和诊断技术来确定哪种真菌造成了感染,从而可使用正确的杀真菌剂。特别对于大田作物例如玉米,这是困难的。如果可以将负责抗性的基因整合入原种、高产种质且不减少产量,那么使用携带遗传的或转基因的抗性来源的玉米系是更实用的。已经描述了对Cg的抗性的遗传来源。已经鉴别出携带一定水平的Cg抗性的几种玉米系(White,等(1979)同上)。它们包括A556、MP305、H21、SP288、CI88A和FR16。使用A556的相互易位测交分析表明,控制对ASR的抗性的基因存在于染色体1、4和8的长臂上以及染色体6的2个臂上(Carson,M.L.(1981),Sources ofinheritance of resistance toanthracnose stalk rot of corn。Ph.D.Thesis,University of Illinois,Urbana-Champaign)。源自这样的系的抗性的渐渗是复杂的。报道了另一个近交LB31携带控制对ASR的抗性的单个显性基因,但是表现得不稳定,尤其在有欧洲玉米螟感染存在时(Badu-Apraku等,(1987)Phytopathology 77:957-959)。发现MP305系携带2个显性的抗性基因,一个起主要作用,一个起次要作用(Carson(1981)同上)。通过美国农业部(Department ofAgriculture)管理的国家植物种质系统(National Plant Germplasm System)(GRIN ID:NSL 250298),可以从密西西比大学(University of Mississippi)得到MP305。参见Compilation of North American Maize Breeding Germplasm,J.T.Gerdes等,CropScience Society of America,1993。从W.Paul Williams,Supervisory ResearchGeneticist USDA-ARS,Corn Host Plant ResistanceResearch Unit,Box 9555,340Dorman Hall,Mississippi State,MS39762,可以得到MP305的种子。
已经报道,在染色体4的长臂上连锁有2个赋予对Cg抗性的基因(Toman,等,(1993),Phytopathology,83:981-986;Cowen,N等(1991) Maize Genetics ConferenceAbstracts 33)。还已经报道了染色体4上的显著抗性数量性状基因座(QTL)(Jung,等,(1994),Theoreticaland Applied Genetics,89:413-418)。Jung等(同上)报道,UMC15可以用于选择MP305中染色体4上的QTL,并提示QTL是在UMC15和UMC66之间的染色体4的12cM区域上。实际上,如下面更详细 地讨论的,在IBM2相邻4遗传学图上报道的UMC15和UMC66之间的区域是约129cM,且按照Jung等(1994,同上)指出的方式选择QTL,会最好也只不过选择具有相当大的连锁拖曳和负表型作用的大染色体区间,且在最坏的情况下,在2个标记之间会发生双重组,从而导致Rcg1基因座的假阳性选择。
关于植物的一般疾病抗性机理已经进行了大量工作。一些抗性机理实际上是非病原体特异性的,或所谓的“非宿主抗性”。它们可能基于细胞壁结构或类似的保护机制。但是,尽管植物缺少含有循环抗体的免疫系统和哺乳动物免疫系统的其它属性,但它们确实具有针对病原体进行特异性保护的其它机理。其中最重要的和最充分研究的是植物疾病抗性基因,或“R”基因。该抗性机理和R基因的非常多的综述之一,可以参见Bekhadir等,(2004),Current Opinion in Plant Biology7:391-399。存在5类公认的R基因:含有核苷酸-结合位点(NBS)和富亮氨酸重复(LRR)的细胞内蛋白;含有胞外LRR结构域的跨膜蛋白(TM-LRR);含有胞质激酶结构域的跨膜和胞外LRR(TM-CK-LRR);含有卷曲螺旋胞质结构域的膜信号锚定蛋白(MSAP-CC);和含有N-末端肉豆蔻基化位点的膜相关激酶(MAK-N)(参见,例如:Cohn,等,(2001),Immunology,13:55-62;Dangl,等(2001),Nature,411:826-833)。
本发明实施方案的抗性基因编码与NBS-LRR类型相关的新R基因。尽管已经描述了多个NBS-LRR基因,但它们对不同病原体的反应和确切作用有很大不同。据申请人所知,在本公开内容中描述的新的R基因是唯一证实了会提供对Cg的抗性的基因。
发明概述
本发明的实施方案基于对来自系MP305的负责抗性表型的主要部分的基因的精细作图、克隆和表征,含有MP305抗性基因座的截短的染色体区间向具有很少或没有连锁拖曳的其它系中的渐渗,该基因作为转基因的应用的证实,和使用育种技术、用分子标记将基因或转基因移进原种系中。
实施方案包括分离的多核苷酸,其包含编码能赋予对毛盘孢属(Colletotrichum)的抗性的多肽的核苷酸序列,其中所述多肽的氨基 酸序列基于Needleman-Wunsch比对算法,当与SEQ ID NO:3或在2006年2月22日保藏在Agricultural Research Service(ARS)CultureCollection的专利保藏号NRRL B-30895的序列相比时,具有至少50%、至少75%、至少80%、至少85%、至少90%和至少95%同一性,或该核苷酸序列的互补体,其中所述互补体和核苷酸序列由相同数目的核苷酸组成,且100%互补。
本发明的其它实施方案包括载体,其包含本发明实施方案的多核苷酸,例如SEQID NO:3,或保藏为专利保藏号NRRL-30895的质粒的序列,以及包含可操作地连接到至少一个调节序列上的本发明实施方案的多核苷酸的重组DNA构建体。本发明也包括植物细胞、以及植物,它们各自包含本发明实施方案的重组DNA构建体,和包含该重组DNA构建体的种子。
本发明包括的方法包括1)转化宿主细胞、包括植物细胞的方法,其包含用本发明实施方案的多核苷酸转化宿主细胞,2)生产植物的方法,其包含用本发明实施方案的重组DNA构建体转化植物细胞,和从转化的植物细胞再生植物,和3)赋予或增强对毛盘孢属和/或茎腐烂的抗性的方法,其包含用本发明实施方案的重组DNA构建体转化植物,从而赋予和/或增强对毛盘孢属或茎腐烂的抗性。
其它实施方案包括,测定玉米植物中存在或不存在本发明实施方案的多核苷酸或Rcg1基因座的方法,其包含下述的至少一个:(a)从玉米植物分离核酸分子,并通过扩增与多核苷酸同源的序列,测定是否存在Rcg1基因,(b)从玉米植物分离核酸分子,并进行DNA印迹杂交,(c)从玉米植物分离蛋白,并使用Rcg1蛋白的抗体进行蛋白印迹,(d)从玉米植物分离蛋白,并使用Rcg1蛋白的抗体进行ELISA测定,或(e)证实存在源自Rcg1 mRNA转录物且Rcg1特有的mRNA序列,从而确定玉米植物中存在多核苷酸或Rcg1基因座。
本发明也包括改变植物或植物细胞中能赋予对毛盘孢属或茎腐烂的抗性的蛋白表达水平的方法,其包含(a)用本发明实施方案的重组DNA构建体转化植物细胞,和(b)在适合表达重组DNA构建体的条件下,培养转化的植物细胞,其中重组DNA构建体的表达导致在转化的宿主中生产改变水平的能赋予对毛盘孢属或茎腐烂的抗性的蛋白。
本发明包括的另一种方法是,赋予或增强玉米植物中对毛盘孢属和/或茎腐烂的抗性的方法,算包含(a)使缺少Rcg1基因座的第一种玉米植物与含有Rcg1基因座的第二种玉米植物杂交,以生成分离群体,(b)筛选分离群体中含有Rcg1基因座的成员,所述Rcg1基因座具有能与连接到或位于Rcg1基因座内的第二种核酸杂交的第一种核酸,不包括UMC15a或UMC66,和(c)选择所述成员,用于进一步杂交和选择。
本发明也包括增强对毛盘孢属和/或茎腐烂的抗性、或将毛盘孢属和/或茎腐烂抗性渐渗入玉米植物的方法,其包含用核酸标记进行玉米植物的标记辅助选择,其中所述核酸标记特异性地与具有第一种核酸序列的核酸分子杂交,所述第一种核酸序列连接在位于MP305的Rcg1基因座上的第二种核酸序列上,并基于标记辅助选择来选择玉米植物。本文公开的特异性的FLP、MZA和Rcg1特异性的SNP标记是本发明的其它方面。
其它实施方案是用于将对毛盘孢属或茎腐烂的抗性渐渗进玉米植物或增强该抗性的种质的改良的供体来源,所述种质包含DE811ASR(BC5)和源自它们的后代。所述后代可以进一步表征为含有本文公开的DE811ASR(BC5)Rcg1序列、在Rcg1内或与之遗传连锁的分子标记、对毛盘孢属的抗性或增强的抗性,或其任意组合。
其它实施方案包括,通过检测玉米植物中至少2个标记的等位基因,鉴别表现出新赋予的或增强的对毛盘孢属抗性的玉米植物的方法,其中至少一个标记是在UMC2041下边、且在Rcg1基因上边的染色体区间上或内部,且至少一个标记是在Rcg1基因下边、且在UMC2200上边的区间上或内部。该方法包含的类似实施方案包括,至少一个标记是在UMC1086下边、且在Rcg1基因上边的染色体区间上或内部,在UMC2285下边、且在Rcg1基因上边的染色体区间上或内部,且至少一个标记是在Rcg1基因下边、且在UMC2200上边的区间上或内部,在Rcg1基因下边、且在UMC2187上边的区间上或内部,或在Rcg1基因下边、且在UMC15a上边的区间上或内部。涉及相同的方法的其它实施方案包括这样的实施方案,其中至少一个标记能检测位于与SEQ ID NO:137的核苷酸7230和7535、SEQ ID NO:173的核苷酸11293和12553、SEQ ID NO:137的核苷酸25412和29086 或SEQ ID NO:137的核苷酸43017和50330相对应的位置的多态性。
其它实施方案包括,通过检测玉米植物中至少2个标记的等位基因,鉴别表现出新赋予的或增强的对毛盘孢属抗性的玉米植物的方法,其中在UMC2041下边、且在Rcg1基因上边的染色体区间上或内部的至少一个标记选自表16列出的标记,且在Rcg1基因下边、且在UMC2200上边的区间上或内部的至少一个标记也选自表16列出的标记。实施方案包括,通过选择至少4个标记或至少6个,鉴别表现出新赋予的或增强的对毛盘孢属抗性的玉米植物的方法,其中至少2个或3个标记是在UMC2041下边、且在Rcg1基因上边的染色体区间上或内部,且至少2个或3个标记是在Rcg1基因下边、且在UMC2200上边的区间上或内部。当在UMC2041下边、且在Rcg1基因上边的染色体区间上或内部的2或3个标记,以及在Rcg1基因下边、且在UMC2200上边的区间上或内部的2或3个标记选自表16列出的那些时,其它实施方案包括该相同方法。该方法的另一个实施方案包括,检测在MZA1112处的等位基因7,检测在MZA2591处的等位基因2,或检测在MZA3434处的等位基因8。通过所包括的方法生产的玉米植物和种子也是本发明的实施方案,包括不包含在表16所示的基因座处在UMC2041处或其上面、或在UMC2200处或其下面的与MP305相同的等位基因的那些玉米植物。
其它实施方案包括,通过检测玉米植物中至少2个标记的等位基因,鉴别表现出新赋予的或增强的对毛盘孢属抗性的玉米植物的方法,其中至少一个标记是在UMC2041下边、且在Rcg1基因上边的染色体区间上或内部,且至少一个标记是在Rcg1基因下边、且在UMC2200上边的区间上或内部,且其中该方法检测位于Rcg1基因内的至少一个标记的存在或不存在。另一个这样的实施方案包括该方法的修饰,其中选择4个标记,其中2个标记是在UMC2285下边、且在Rcg1基因上边的染色体区间内部,且至少2个标记是在Rcg1基因下边、且在UMC15a上边的区间内部。该方法的其它实施方案包括Rcg1基因,该Rcg1基因已经从供体玉米植物,包括MP305或DE811ASR(BC5),渐渗进受体玉米植物,以生产渐渗的玉米植物。该方法也包括这样的情形,其中选择渐渗的玉米植物在Rcg1基因下边和UMC15a上边的重组事件,从而使得渐渗的玉米植物保持第一个 MP305衍生的在Rcg1基因下边、且在UMC15a上边的染色体区间,且不保持第二个MP305衍生的在UMC15a处和下边的染色体区间。通过这些方法生产的玉米植物和种子也是本发明的实施方案。本发明包括的渐渗的玉米植物包括作为PH705、PH5W4、PH51K或PH87P的Rcg1基因座转变的那些,或其后代。
本发明的其它实施方案是鉴别表现出增强的对毛盘孢属感染的抗性的玉米植物的方法,其通过检测玉米植物在Rcg1基因座处存在或不存在至少一个标记,和选择其中存在至少一个标记的玉米植物来实现。实施方案包括,当至少一个标记是在SEQ ID NO:137上或内部时,以及当至少一个标记能检测位于SEQ ID NO:137中与核苷酸1至536、核苷酸7230至7535、核苷酸11293至12553、核苷酸25412至29086和核苷酸43017至50330的位置相对应的位置处的多态性时,以及当至少1个标记是在Rcg1编码序列上或内部,或位于SEQIDNO:1所述多核苷酸上或内部时。另一个实施方案包括,当该方法检测SEQ ID NO:1中与位置413、958、971、1099、1154、1235、1250、1308、1607、2001、2598和3342的一个或多个相对应的位置处的单核苷酸多态性时。这些实施方案中的方法包括的标记包含,SNP标记C00060-01和C00060-02,用于检测源自Rcg1 mRNA转录物且Rcg1特有的mRNA序列的标记,和由在该公开内容中所述的引物对产生的扩增子上的FLP标记,例如SEQ ID NO:35-42中的那些和它们的互补体。另一个实施方案包括,当该方法检测在Rcg1基因座内存在或不存在至少2个标记时,包括C00060-01和C00060-02。通过所述方法生产的玉米植物和种子也是本发明的实施方案。本发明包括的渐渗的玉米植物包含,作为PH705、PH5W4、PH51K或PH87P的Rcg1基因座转变的那些,或其后代。这样的实施方案包括玉米种子,其包含第一个MP305衍生的由BNLG2162和UMC1051定义的染色体区间,且不包含第二个MP305衍生的在UMC2041上边或在UMC1051下边的染色体区间,且当该玉米种子包含Rcg1基因,且当生长时生成表现出对毛盘孢属感染的抗性的玉米植物。该实施方案的种子也包括下述玉米种子,其包含第一个MP305衍生的在UMC2285和UMC15a之间但是不包括该二者的染色体区间,且不包含第二个MP305衍生的在UMC2285处或上边、或在UMC15a处或下边的染色 体区间,而且这样的包含Rcg1基因的玉米种子在生长时,生成表现出对毛盘孢属感染的抗性的玉米植物。由该种子生产的玉米植物和植物细胞也包含在本发明的实施方案中。
其它实施方案包括命名为DE811ASR(BC5)的玉米品种的种子,或保藏为ATCC登记号PTA-7434的玉米种子,或源自该品种的后代种子,其包含Rcg1基因,在生长时生成表现出增强的或新赋予的对毛盘孢属感染的抗性的植物。从该种子生长的植物和植物细胞也是实施方案,以及包含第一个MP305或DE811ASR(BC5)衍生的在UMC2285和UMC15a之内但是不包括该二者的染色体区间的后代种子,和不包含第二个MP305衍生的在UMC2285处或上边、或在UMC15a处或下边的染色体区间的后代种子。也包含上述种子的植物和植物细胞作为实施方案。本发明也包括作为PH705、PH5W4、PH51K或PH87P的Rcg1基因座转变的后代种子,或其后代,以及包含在MZA11123处的等位基因7、在MZA2591处的等位基因2或在MZA3434处的等位基因8中的至少2个或更多个的后代种子。其它实施方案包括,包含在MZA2591.32处的胞嘧啶核苷酸、在MZA2591.35处的胸腺嘧啶核苷酸和在MZA3434.17处的胞嘧啶核苷酸的后代种子。
其它实施方案包括用于鉴别表现出新赋予的或增强的对毛盘孢属感染的抗性的玉米植物的计算机系统,其包含数据库,该数据库包含一种或多种玉米植物的紧密连锁到Rcg1基因座或在Rcg1基因座内的4个或更多个标记基因座的等位基因评分信息,和检查所述数据库来确定由4个或更多个标记基因座定义的染色体区间或其部分的遗传、并计算一种或多种玉米植物是否包含Rcg1基因的指令。其它实施方案包括用于鉴别表现出新赋予的或增强的对毛盘孢属感染的抗性的玉米植物的计算机系统,其包含数据库,该数据库包含一种或多种玉米植物的在Rcg1基因座内的1个或多个标记基因座的等位基因评分信息,和检查所述数据库来确定Rcg1基因座的遗传的指令。这样的计算机系统的一种或多种玉米植物的等位基因评分信息可以另外包含2、3或更多个在Rcg1基因座内的标记基因座。
实施方案也包括分别在SEQ ID NO:140-146上或内部的MZA3434、MZA2591、MZA11123、MZA15842、MZA1851、MZA8761和MZA11455的遗传标记。其它实施方案包括位于Rcg1基因座或Rcg1 基因上或内的遗传标记,包括位于SEQ ID NO:137上的那些,例如位于与1至536、7230至7535、11293至12553、25412至29086的核苷酸相对应的区域和核苷酸43017至50330的区域上的那些。包含的标记也包括位于SEQ ID NO:1上的那些,例如位于SEQ ID NO:1的核苷酸位置550-658上或内部的那些,或位于SEQ ID NO:1的核苷酸位置1562-1767上或内部的那些。实施方案的标记包括在由位于下述引物对产生的扩增子上的标记上的那些,其中第一个引物是SEQID NO:23-41的奇数序列,而其中第二个引物是SEQID NO:24-42的偶数序列。
其它实施方案包括可通过包含下述步骤的方法得到的玉米植物:使作为第一种亲本植物的MP305或DE811ASR(BC5)[保藏号PTO-7434]与作为第二种亲本植物的缺少Rcg1基因座的不同植物杂交,从而得到包含第一种亲本的Rcg1基因座的后代;且任选地另外包含1个或多个其它育种步骤,以得到包含第一种亲本的Rcg1基因座的一个或多个进一步世代的后代。这样实现的玉米植物包括近交和杂种植物。本发明包括这样的植物的种子,包括对于Rcg1基因座纯合和杂合的那些种子,和通过加工那些种子来得到玉米产品的方法。在食物或饲料或玉米产品(例如玉米面粉、玉米粗粉和玉米油)的生产中使用这样的种子,也是本发明的实施方案。
附图简述
图1是显示各县在2002年炭疽病茎腐烂感染严重性的美国地图。
图2(a、b、c)是将它与其它已知NBS-LRR多肽相对比的实施方案多肽序列(SEQ IDNO:3)的比对。
图3是用Windows QTL Cartographer软件生成的图,它显示了负责Cg抗性表型的基因座位于FLP标记定义的染色体上的特定位置(X轴)处的机会(Y轴)的统计学分析。
图4是RT-PCR反应物的等分试样的电泳凝胶印迹,它揭示了260bp带的存在,该260bp带存在于源自受感染的和未受感染的抗性植物的样品中,但是在易感样品中不存在。从来自DE811和DE811ASR茎组织的12.5ng总RNA中,得到了RT-PCR片段。使用Rcg1特异性的引物和18S rRNA引物作为内部标准,扩增通过反转录得到的 cDNA。
图5是用于验证Rcg1基因的Mu-标记策略的示意图。
图6是Rcg1的基因结构,它显示了4种不同增变基因插入位点的位置。
图7(a-b)是一系列遗传学图图像,以递增的分辨率显示了邻近Rcg1基因的区域的图。7(a)中标有“A”的图的图距按cM计,且与IBM2相邻4遗传学图有关。使用来自BC7群体的184个个体,形成7(b)中标有“B”的图的图距,且使用来自BC7群体的1060个个体,形成7(b)中标有“C”的图的图距。与公开的图相比时,BC7群体的遗传作图使图分辨率增加超过10-倍。显示在每个图右边的标记的位置是基于它们在物理图上的定位的外推。
图8(a-b)的遗传学图图像显示了DE811ASR(BC3)中含有Rcg1基因的染色体区间,在DE811ASR(BC5)中得到的含有Rcg1基因的染色体区间的减小的大小,和最初使用DE811ASR(BC5)作为供体来源得到的近交中染色体区间的进一步减小的大小。关于所有标记,在Maize GDB上可公开得到的IBM2相邻图上报道显示的图距,除了MZA15842、FLP27和FLP56之外,使用相对于图7(b)中图B和C的高分辨率图的回归分析,外推它们的图位置,其中使用两种图共有的UMC2285、PHI093和CSU166a位置。
图9(a-b)。图9(a)显示了来自DE811ASR(BC5)的非同线性区域相对于B73和Mo17的比对。图9(a)中的BAC大小是估计值。图9(b)显示了其上存在Rcg1的SEQ ID NO:137所述的非同线性区域的部分,包括其中的重复区域以及Rcg1外显子1和2。
图10(a-b)显示了分别在DE811ASR(BC5)和DE811系中接种Cg后15天时不同单个植物中平均叶子损伤大小的分布。
图11显示了接种后7和15天时感染了Cg的DE811和DE811ASR(BC5)植物上的平均叶子损伤大小的对比。
图12显示了使DE811ASR(BC5)和DE811与指示的系杂交产生的杂种的茎在接种Cg后4-5周时疾病的平均严重性。
图13显示了与使DE811与指示的系杂交产生的杂种的产量相比,使DE811ASR(BC5)与指示的系杂交产生的杂种在接种Cg后成熟时产量的提高。
图14显示了接种后4-5周从DE811ASR(BC5)或MP305衍生的近交系的茎中由Cg造成的5个不同位置处的疾病严重性。Rcg1基因阳性和阴性的系之间的差异是统计学上显著的,P值小于0.05。
图15显示了来自Rcg1阳性和阴性的近交PH705系的代表性茎的疾病进展。
图16显示了来自Rcg1阳性和阴性的近交PH87P系的代表性茎的疾病进展。
图17显示了通过使DE811ASR(BC5)与指定系杂交衍生的杂种的茎的在5个不同位置处接种4-5周后由Cg造成的疾病严重性。Rcg1基因阳性和阴性的系之间的差异是统计学上显著的,P值小于0.05,例外是位置5。
图18显示了从Rcg1阳性和阴性的PH4CV和PH705系生成的杂种的代表性茎的疾病进展。
图19显示了从Rcg1阳性和阴性的PH705和PH87P系生成的杂种的代表性茎的疾病进展。
图20显示了给玉米茎的疾病严重性评分的方法。给茎评出指定为antgr75的评分,它代表着超过75%变色的节间的数目(最高达5,包括接种的节间)。这产生范围为0-5的评分,0表示在接种的节间小于75%变色,且5表示前5个节间(包括接种的节间)的75%或更多变色。
图21显示了与插入了含有DE811ASR(BC5)的Rcg1非同线性区域的区域同源的B73物理图上的毗连群,这证实了在可以得到序列信息的目标区域中可得到许多B73衍生的细菌人工染色体(BAC)。
图22显示了含有MZA和公开标记的遗传学图与Mo17和B73的物理图的比对。使用来自BC7作图群体的1060个体,显示遗传学图距离。Mo17BAC文库的分析也表明Rcg1基因座与Mo17的对应区域是非同线性的。从Mo17物理图定位外推出虚线显示的标记在B73图中的定位。从B73物理图定位外推出虚线显示的标记在Mo17图中的定位。
图23显示了为使用InvaderTM反应而设计的Rcg1杂交标记的寡核苷酸。
图24显示了为使用TaqMan反应而设计的Rcg1杂交标记的寡 核苷酸。
图25显示了从接种后0、3、6、9和13天(dpi)的抗性的和易感的植物分离的约1.5mg聚腺苷酸-富集的RNA得到的RNA印迹的结果。用随机引物标记的420 bp Rcg1片段探测膜。抗性组织来自DE811ASR(BC5),且易感组织来自DE811。
图26表明,使用Rcg1特异性的引物对的PCR扩增仅仅扩增抗性系DE811ASR(BC5)和供体亲本MP305,但是在易感系DE811中却不能,例外是FLP110F-R,它扩增高度保守的卷曲螺旋-核苷酸结合位点区域,并从而扩增DE811系的基因组中非Rcg1的其它区域。100bp梯用于片段定大小。
发明详述
本发明实施方案提供了涉及诱导植物的病原体抗性、尤其是真菌抗性的组合物和方法(或工艺)。该组合物是赋予或增强对植物真菌病原体的抗性的新的核苷酸和氨基酸序列。具体地,某些实施方案提供了具有SEQ ID NO:3所述氨基酸序列的多肽,和其变体和片段。另外提供了分离的核酸分子,和其变体和片段,它们包含编码SEQ IDNO:3所示氨基酸序列的核苷酸序列。
在SEQ ID NO:1和4中,描述了编码SEQ ID NO:3的多肽的核苷酸序列。在本文中也公开了包含编码实施方案的多肽的核苷酸序列的植物、植物细胞、种子和微生物。
在布达佩斯条约规定下,2006年2月22日将Rcg1核酸分子保藏在位于国家农业利用研究中心(National Center for AgriculturalUtilization Research(NCAUR))的微生物基因座和生物工艺研究单位(Microbial Genomics and Bioprocessing ResearchUnit)的农业研究机构保藏中心(Agricultural Research Service(ARS)CultureCollection)。为保藏物给出下面的登记号:NRRL B-30895。NCAUR的地址是1815N.University Street,Peoria,IL,61604。在国际承认用于专利程序的微生物保存布达佩斯条约的条款下,维持该保藏。该保藏仅仅为了本领域技术人员的方便而作出的,且不是对在35 U.S.C.§112下需要的保藏物的承认。保藏将是不可撤回的,且在专利授权后对公众的获取没有限制或条件。但是,应当理解,保藏物的可获得并不构成对破坏由 政府行为授予的专利权的实施主题发明的许可。
在2006年3月13日,将2500粒DE811ASR(BC5)种子的样品保藏在美国典型培养物保藏中心(American Type Culture Collection(ATCC)),10801 University Blvd.,Manassas,VA 20110-2209,USA,分配的保藏号是PTO-7434。在本申请未决期间,专利和商标官员(Commissioner of Patents and Trademarks)、在请求后获得授权的由官员确定的人员和在提交本专利申请的外国专利局的相应官员可以获得该保藏物。在国际承认用于专利程序的微生物保存布达佩斯条约的条款下,维持该保藏物。保藏将是不可撤回的,且在专利授权后对公众的获取没有限制或条件。但是,应当理解,保藏物的可获得并不构成对破坏专利权的实施主题发明或方法的许可。
实施方案的全长多肽(SEQ ID NO:3)与NBS-LRR家族的已知多肽具有不同程度的同源性。具体地,实施方案的新多肽与从稻(Oryzasativa)(登记号NP_910480(SEQ ID NO:14)、NP_910482(SEQ IDNO:16)、NP_921091(SEQ ID NO:17)和NP_910483(SEQ ID NO:15))和大麦(Hordeum Vulgare)(登记号AAG37354(SEQ ID NO:18);Zhou等,(2001)Plant Cell13:337-350)分离的NBS-LRR蛋白具有同源性。图1提供了SEQ ID NO:3所述的氨基酸序列与稻和大麦抗真菌蛋白(SEQ ID NO:14-18)的比对。
使用GAP程序的氨基酸比对表明,SEQ ID NO:3与稻抗真菌蛋白NP_910480(SEQ IDNO:14)共有约42.3%序列相似性,与稻蛋白NP_910482(SEQ ID NO:16)共有41.7%序列相似性,与稻蛋白NP_921091(SEQ ID NO:17)共有56.9%相似性,且与稻蛋白NP_910483(SEQID NO:15)共有42.1%序列相似性。此外,SEQ IDNO:3与大麦蛋白AAG37354(SEQ ID NO:18)共有约42.8%序列相似性。
NBS-LRR组的R-基因是迄今为止发现的最大类R-基因。在鼠耳芥(Arbidopsisthaliana)中,预期该基因组中存在超过150个(Meyers,等,(2003),Plant Cell,15:809-834;Monosi,等,(2004),Teeoretical andApplied Genetics,109:1434-1447),而在稻中,已经预测了约500个NBS-LRR基因(Monosi,(2004)同上)。NBS-LRR类的R基因包含2个亚类。第一类NBS-LRR基因含有在它们的N’末端的TIR-Toll/白细胞 介素-1样结构域;迄今为止仅在双子叶植物中发现它们(Meyers,(2003)同上;Monosi,(2004)同上)。第二类NBS-LRR含有在它们N末端的卷曲螺旋结构域或(nt)结构域(Bai,等(2002)Genome Research,12:1871-1884;Monosi,(2004)同上;Pan,等,(2000),Journal of MolecularEvolution,50:203-213)。已经在双子叶植物和单子叶植物物种中发现了第二类NBS-LRR。(Bai,(2002)同上;Meyers,(2003)同上;Monosi,(2004)同上;Pan,(2000)同上)。
基因的NBS结构域似乎在植物防御机制的信号传导中起作用(vander Biezen,等,(1998),Current Biology: CB,8:R226-R227)。LRR区域似乎是与病原体AVR产物相互作用的区域(Michelmore,等,(1998),Genome Res.,8:1113-1130;Meyers,(2003)同上)。与NBS结构域相比,该LRR区域处于大得多的多样性选择压力下(Michelmore,(1998)同上;Meyers,(2003)同上;Palomino,等,(2002),Genome Research,12:1305-1315)。LRR结构域也见于其它背景下;这些20-29-残基基序以串联阵列存在于具有不同功能的许多蛋白中,所述功能例如激素-受体相互作用、酶抑制、细胞粘附和细胞运输。许多最近的研究揭示,LRR蛋白参与早期哺乳动物发育、神经发育、细胞极化、基因表达的调节和细胞凋亡信号传导。
实施方案的基因显然与第2类家族的NBS-LRR相关,但是不会完全拟合经典模型。氨基端与所谓的核苷酸结合位点(NBS)具有同源性。也存在富亮氨酸的区域,如预期的,位于NBS的下游。但是,与以前研究的NBS-LRR蛋白不同,富亮氨酸的区域缺少在更经典的LRR结构域中发现的系统性重复性质,在一般Lxx重复模式后一致性更低,且尤其不具有Wang等((1999)Plant J.19:55-64;尤其参见,图5)或Bryan等((2000),Plant Cell 12:2033-2045;尤其参见,图3)所述的共有序列的实例。
由于LRR区域是NBS-LRR的受体部分,所以当发现新的LRR时,例如本发明公开的那些,从该序列不能立即明显得出它的活性范围,即它会起反应的病原体的范围。在Cg抗性表型的基础上,分离了实施方案的基因,且因此新的LRR对Cg反应。但是,不排除它对在此前进行的工作中没有测试的其它病原体反应。
实施方案的核酸和多肽可以用于赋予或增强植物的真菌抗性的方 法中。因此,本文公开的组合物和方法可以用于保护植物免受真菌病原体。“病原体抗性”、“真菌抗性”和“疾病抗性”意指该植物避免疾病症状,所述症状是植物-病原体相互作用的结果。也就是说,预防病原体造成植物疾病和相关的疾病症状,或者,使病原体造成的疾病症状最小化或减轻,例如,减少应激和相关的产量损失。本领域技术人员将明白,本文公开的组合物和方法可以与本领域用于保护植物免受病原体攻击的其它组合物和方法一起使用。
因此,实施方案的方法可以用于保护植物免受疾病,尤其由植物真菌病原体造成的那些疾病。本文使用的“真菌抗性”指,与野生型植物相比,增强的对真菌病原体的抗性或耐受性。作用可以从对真菌病原体作用耐受性的轻微增加(例如,部分抑制)至完全抗性,从而使植物不受真菌病原体存在的影响。增加水平的对特定真菌病原体或对更广谱真菌病原体的抗性,构成“增强的”或提高的真菌抗性。本发明实施方案也将增强或提高真菌植物病原体抗性,从而使植物对真菌病原体或病原体的抗性增加。术语“增强”指提高、增加、扩增、倍增、升高、增高等。在本文中,将本发明的植物描述成抗Cg感染,或对Cg感染具有′增强的抗性′,这是本发明的Rcg1基因座的结果。因此,与因为缺少Rcg1基因座而对Cg感染易感的等价植物相比,它们通常表现出增加的对疾病的抗性。例如,使用实施例11(也参见图20)所述的评分系统,与因为缺少Rcg1基因座而对Cg感染易感的等价植物相比时,它们的感染评分通常表现出1点、2点、或3点或更多的降低,甚至评分减少至1或0。
在具体方面,赋予或增强植物的真菌抗性的方法包含,向植物中导入至少一个表达盒,其中所述表达盒包含编码实施方案的抗真菌多肽的核苷酸序列,其可操作地连接到驱动在植物中的表达的启动子上。植物表达该多肽,从而赋予植物真菌抗性,或提高植物的固有抗性水平。在具体实施方案中,该基因赋予对真菌病原体Cg的抗性。
实施方案的抗真菌多肽的表达,可以靶向其中病原体抗性是特别重要的特定植物组织,例如,叶子、根、茎或维管组织。这样的组织-优选的表达可以通过根-优选的、叶子-优选的、维管组织-优选的、茎-优选的、或种子-优选的启动子来实现。
本文使用的“核酸”包括单链或双链形式的脱氧核糖核苷酸或核糖 核苷酸聚合物,且除非另有限制,包括具有天然核苷酸的基本性质、表现为它们以与天然存在的核苷酸类似的方式与单链核酸杂交的已知类似物(例如,肽核酸)。
术语“多肽”、“肽”和“蛋白”在本文中互换地用于指氨基酸残基的聚合物。该术语适用于氨基酸聚合物,其中一个或多个氨基酸残基是对应天然存在的氨基酸的人工化学类似物,也适用于天然存在的氨基酸聚合物。实施方案的多肽可以从本文公开的核酸生产,或通过使用标准的分子生物学技术生产。例如,实施方案的截短的蛋白可以通过在适当宿主细胞中表达实施方案的重组核酸来生产,或者通过先体外后体内方法的组合,例如蛋白酶消化和纯化来生产。
当在指定的核酸的上下文中使用时,本文使用的术语“编码”或“编码的”指,该核酸包含指导核苷酸序列翻译成指定蛋白的必需信息。通过使用密码子,指定编码蛋白的信息。编码蛋白的核酸可以包含在核酸的翻译区内的非翻译序列(例如,内含子),或可以缺少这样的间插非翻译序列(例如,象在cDNA中那样)。
本发明实施方案包括分离的或基本上纯化的多核苷酸或蛋白组合物。“分离的”或“纯化的”多核苷酸或蛋白、或其生物活性部分,是相当大地或基本上不含有在它天然存在的环境中发现的正常伴随该多核苷酸或蛋白或与其相互作用的组分。因而,分离的或纯化的多核苷酸或蛋白基本上不含有其它细胞材料,或当通过重组技术(例如PCR扩增)生产时的培养基,或当化学合成时基本上不含有化学前体或其它化学药品。最佳地,“分离的”多核苷酸不含有在该多核苷酸所来源的生物的基因组DNA中天然侧接该多核苷酸的序列(即,位于多核苷酸的5′和3′末端的序列)(例如,蛋白编码序列)。例如,在各种实施方案中,分离的多核苷酸可以含有小于约5kb、约4kb、约3kb、约2kb、约1kb、约0.5kb、或约0.1kb的在该多核苷酸所来源的细胞的基因组DNA中天然侧接该多核苷酸的核苷酸序列。基本上不含有细胞材料的蛋白包括含有小于约30%、约20%、约10%、约5%、或约1%(按干重计)的污染蛋白的蛋白制剂。当重组生产实施方案的蛋白、或其生物活性部分时,培养基最佳地代表小于约30%、约20%、约10%、约5%、或约1%(按干重计)的化学前体或非目标蛋白化学药品。
实施方案也包括公开的核苷酸序列和其编码的蛋白的片段和变体。“片段”意在指核苷酸序列的部分或氨基酸序列的部分,和由此编码的蛋白。核苷酸序列片段可以编码保持天然蛋白的生物活性的蛋白片段,并因此具有赋予植物真菌抗性的能力。或者,用作杂交探针的核苷酸序列片段不一定编码保持生物活性的片段蛋白。因而,核苷酸序列片段可以是至少约15个核苷酸、约50个核苷酸、约100个核苷酸,且最高达编码实施方案多肽的全长核苷酸序列。
编码实施方案多肽的生物活性部分的核苷酸序列片段将编码至少约15、约25、约30、约40、或约50个邻接氨基酸,或最高达实施方案全长多肽中存在的氨基酸总数(例如,SEQ ID NO:1编码的肽的980个氨基酸)。用作杂交探针或PCR引物的核苷酸序列片段通常不需要编码蛋白的生物活性部分。
当提及指定的多核苷酸时,本文使用的“全长序列”指天然序列的整个核酸序列。“天然序列”意在指内源序列,即见于生物基因组中的非工程改造的序列。
因而,实施方案核苷酸序列的片段可以编码多肽的生物活性部分,或它可以是用作使用下述方法的杂交探针或PCR引物的片段。通过分离实施方案核苷酸序列之一的部分,表达编码的蛋白部分,和评价编码的蛋白部分赋予或增强植物的真菌抗性的能力,可以制备抗病原体多肽的生物活性部分。作为实施方案的核苷酸序列的片段的核酸分子包含至少约15、约20、约50、约75、约100、或约150个核苷酸,或最高达本文公开的全长核苷酸序列中存在的核苷酸数目(例如,对于SEQ ID NO:1,4212个核苷酸)。
“变体”意在指基本上类似的序列。对于多核苷酸,变体包含在天然多核苷酸内的一个或多个内部位点处缺失和/或添加一个或多个核苷酸,和/或在天然多核苷酸的一个或多个位点置换一个或多个核苷酸。本文使用的“天然”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。本领域技术人员将认识到,可以构建实施方案核酸的变体,从而维持可读框。关于多核苷酸,保守变体包括这样的序列,其因为遗传密码的简并性,编码实施方案多肽之一的氨基酸序列。天然存在的等位基因变体,例如使用众所周知的分子生物学技术(例如,下述的聚合酶链反应(PCR)和杂交技术)可以鉴别出的那些。 变体多核苷酸也包括合成地衍生的多核苷酸,例如使用例如定点诱变产生、但是仍然编码实施方案蛋白的那些。通常,如通过本文别处所述的序列比对程序和参数测得的,实施方案的特定多核苷酸的变体与该特定多核苷酸将具有至少约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高序列同一性。
通过对比变体多核苷酸编码的多肽和参照多核苷酸编码的多肽之间的百分比序列同一性,也可以评价实施方案的特定多核苷酸(即,参照多核苷酸)的变体。因而,例如,公开了编码与SEQ ID NO:3的多肽具有给定百分比序列同一性的多肽的分离的多核苷酸。使用本文别处所述的序列比对程序和参数,可以计算任意2个多肽之间的百分比序列同一性。当通过对比它们编码的2个多肽共有的百分比序列同一性来评价任意一对给定的实施方案多核苷酸时,2个编码的多肽之间的百分比序列同一性是至少约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高序列同一性。
“变体”蛋白意在指,通过在天然蛋白的一个或多个内部位点处缺失或添加一个或多个氨基酸,和/或在天然蛋白的一个或多个位点处置换一个或多个氨基酸,从天然蛋白衍生出的蛋白。实施方案包括的变体蛋白是生物活性的,也就是说,它们继续具有需要的天然蛋白的生物活性,即本文所述的赋予或增强植物真菌病原体抗性的能力。这样的变体可以源自例如基因多态性或人工操作。如通过本文别处所述的序列比对程序和参数测得的,实施方案天然蛋白的生物活性变体与天然蛋白的氨基酸序列将具有至少约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高的序列同一性。实施方案蛋白的生物活性变体可以与该蛋白相差少至约1-15个氨基酸残基,少至约1-10个、例如约6-10个、少至约5个、少至4、3、2或甚至1个氨基酸残基。
可以以各种方式改变实施方案的蛋白,包括氨基酸置换、缺失、 截短和插入。这样的操作的方法是本领域普遍已知的。例如,通过DNA突变,可以制备出抗病原体蛋白的氨基酸序列变体和片段。诱变和多核苷酸改变的方法是本领域众所周知的。参见,例如,Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等(1987)Method s inEnzymol.154:367-382;美国专利号4,873,192;Walker和Gaastra,编.(1983)Techniquesin Molecular Biology(MacMillanPublishing Company,New York)和其中引用的参考文献。关于不影响目标蛋白的生物活性的适当氨基酸置换的指南,可以参见本文引作参考的Dayhoff等(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)的模型。保守置换可能是最佳的,例如将一个氨基酸替换为具有类似性质的另一个氨基酸。
因而,实施方案的基因和多核苷酸包括天然存在的序列以及突变体形式。类似地,实施方案的蛋白包括天然存在的蛋白及其变体和修饰形式。这样的变体将继续具有需要的赋予或增强植物真菌病原体抗性的能力。显然,将在编码变体的DNA中产生的突变必须不能将该序列置于读框之外,且最佳地将不产生互补区,后者会产生二级mRNA结构。参见,欧洲专利号0075444。
预期本文包含的蛋白序列的缺失、插入和置换不产生蛋白特征的根本变化。但是,当事先难以预测置换、缺失或插入的确切作用时,本领域技术人员将明白,将通过筛选已经用变体蛋白转化的转基因植物,以确定对植物的抗真菌病原体攻击能力的作用,来评价该作用。
变体多核苷酸和蛋白也包括源自诱变或重组操作的序列和蛋白,包括且不限于诸如DNA改组的操作。本领域技术人员能预见到会改变蛋白响应的病原体范围的修饰。利用这样的操作,可以操纵一个或多个不同的蛋白编码序列,以生成具有所需的性质的新蛋白。以此方式,从包含具有相当大序列同一性、且可以体外或体内同源重组的序列区域的相关序列多核苷酸群体生成重组多核苷酸文库。例如,使用该方案,可以使编码目标结构域的序列基序在实施方案的蛋白基因和其它已知蛋白基因之间改组,以得到编码具有提高的目标性质的蛋白的新基因,例如提高的赋予或增强植物真菌病原体抗性的能力。这样的DNA改组的策略是本领域已知的。参见,例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;Stemmer(1994)Nature 370: 389-391;Crameri等(1997)Nature Biotech.15:436-438;Moore等(1997)J.Mol.Biol.272:336-347;Zhang等(1997)Proc.Natl.Acad.Sci.USA94:4504-4509;Crameri等(1998)Nature 391:288-291;和美国专利号5,605,793和5,837,458。
实施方案的多核苷酸可以用于从其它生物、尤其其它植物分离对应的序列。以此方式,诸如PCR、杂交等的方法等可以用于鉴别这样的序列,这基于它们与本文所述序列的序列同源性。实施方案包括,基于它们与本文所述整个序列或其变体和片段的序列同一性而分离的序列。这样的序列包括作为公开序列的直向同源物的序列。“直向同源物”意在指源自共同祖先基因且由于物种形成而见于不同物种中的基因。当它们的核苷酸序列和/或它们编码的蛋白序列共有至少约60%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、或更大的序列同一性时,认为在不同物种中发现的基因是直向同源物。直向同源物的功能经常在物种间是高度保守的。因而,实施方案包括分离的多核苷酸,其编码赋予或增强真菌植物病原体抗性的蛋白,且在严格条件下与本文公开的序列或其变体或片段杂交。
在PCR方案中,可以设计寡核苷酸引物用于PCR反应中,以从提取自任意目标生物的cDNA或基因组DNA扩增对应的DNA序列。设计PCR引物和PCR克隆的方法,是本领域普遍已知的,且公开在Sambrook等(1989)Molecular Cloning:A Laboratory Manual(2d ed.,Co1d Spring Harbor Laboratory Press,Plainview,New York)。也参见Innis等,编.(1990)PCR Protocols:A Guide to Methods andApplications(Academic Press,NewYork);Innis和Gelfand,编.(1995)PCR Strategies(Academic Press,New York);和Innis和Gelfand,编.(1999)PCR Methods Manual(Academic Press,New York)。已知的PCR方法包括、且不限于,使用配对引物、嵌套引物、单特异性引物、简并引物、基因-特异性引物、载体-特异性引物、部分地错配的引物等的方法。
在杂交技术中,使用全部或部分已知的多核苷酸作为探针,该探针选择性地与存在于从选定的生物克隆的基因组DNA片段或cDNA片段群体(即,基因组或cDNA文库)中的其它对应多核苷酸杂交。杂 交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,且可以用可检测基团(例如32P)或任意其它可检测标记作出标记。因而,例如,通过标记基于实施方案多核苷酸的合成寡核苷酸,可以制作杂交探针。制备杂交探针和构建cDNA和基因组文库的方法,是本领域普遍已知的,且公开在Sambrook等(1989)同上。
例如,本文公开的整个多核苷酸、或其一个或多个部分,可以用作能特异性与对应多核苷酸和信使RNA杂交的探针。为了实现在许多条件下的特异性杂交,这样的探针包括独特的、且最佳为至少约10个核苷酸长、至少约15个核苷酸长或至少约20个核苷酸长的序列。这样的探针可以用于通过PCR从选定的生物扩增对应多核苷酸。该技术可以用于从所需生物分离其它编码序列,或作为确定生物中存在编码序列的诊断测定。杂交技术包括铺平板的DNA文库的杂交筛选(噬斑或菌落;参见,例如,Sambrook等(1989)同上)。
这样的序列的杂交可以在严格条件下进行。“严格条件”或“严格杂交条件”意指这样的条件,在该条件下,探针将与它的靶序列的杂交程度在检测上大于与其它序列的杂交程度(例如,为背景的至少2-倍)。严格条件是序列-依赖性的,且在不同情况下将是不同的。通过控制杂交和/或洗涤条件的严格性,可以鉴别出与探针100%互补的靶序列(同源探测)。或者,可以调节严格性条件,以允许序列中的有些错配,从而检测更低程度的相似性(异源探测)。通常,探针的长度小于约1000个核苷酸,最佳长度小于500个核苷酸。
一般地,严格条件是这样的,其中盐浓度小于约1.5M Na离子,通常约0.01-1.0MNa离子浓度(或其它盐),pH7.0-8.3,且对于短探针(例如,10-50个核苷酸),温度是至少约30℃,而对于长探针(例如,大于50个核苷酸),温度是至少约60℃。通过加入去稳定剂例如甲酰胺,也可以达到严格条件。示例性的低严格性条件包括,在37℃用30-35%甲酰胺、1MNaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,及在50-55℃在1X-2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格性条件包括,在37℃、在40-45%甲酰胺、1.0M NaCl、1%SDS中杂交,和在55-60℃、在0.5X-1X SSC中洗涤。示例性的高严格性条件包括,在37℃、在50%甲酰胺、1M NaCl、1%SDS中杂交,最后在60-65℃、在0.1X SSC 中洗涤至少30分钟。任选地,洗涤缓冲液可以包含约0.1%-约1%SDS。杂交持续时间通常小于约24小时,经常约4-约12小时。洗涤持续时间将至少是足以达到平衡的时间长度。
特异性通常随杂交后的洗涤而变化,关键因素是最终洗涤溶液的离子强度和温度。对于DNA-DNA杂交体,可以从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的方程估计出热解链温度(Tm):Tm =81.5℃+16.6(1og M)+0.41(%GC)-0.61(%form)-500/L;其中M是单价阳离子的体积摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,且L是按碱基对计算的杂交体长度。Tm是50%的互补靶序列与完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。对于每1%的错配,Tm降低约1℃;因而,可以调节Tm、杂交和/或洗涤条件,以与所需同一性的序列杂交。例如,如果要得到具有≥90%同一性的序列,则可以使Tm降低10℃。通常,将严格性条件选择在,在确定的离子强度和pH处,比特定序列序列和它的互补体的Tm低约5℃。但是,非常严格的条件可以使用比Tm低1、2、3或4℃的杂交和/或洗涤;中等严格性条件可以使用比Tm低6、7、8、9或10℃的杂交和/或洗涤;低严格性条件可以使用比Tm低11、12、13、14、15或20℃的杂交和/或洗涤。使用该方程、杂交和洗涤组合物和所需的Tm,本领域普通技术人员将理解,内在地描述了杂交和/或洗涤溶液的严格性的变化。如果所需的错配程度产生小于45℃(水性溶液)或32℃(甲酰胺溶液)的Tm,则最佳地增加SSC浓度,从而可以使用更高的温度。关于核酸杂交的广泛指南,参见Tijssen(1993)Laboratory Techniques in Biochemistryand MolecularBiology-Hybridization with Nucleic Acid Probes,Part I,Chapter 2(Elsevier,NewYork);和Ausubel等,编.(1995)CurrentProtocols in Molecular Biology,Chapter 2(Greene Publishing andWiley-Interscience,New York)。参见Sambrook等(1989)同上。
各种方法可以用于检查存在或不存在DNA、RNA、或蛋白的特定序列。它们包括,例如,DNA印迹、RNA印迹、蛋白印迹和ELISA分析。这样的技术是本领域技术人员众所周知的,且存在许多参考文献,它们提供了详细方案。这样的参考文献包括Sambrook等(1989)同上,和Crowther,J.R.(2001),The ELISA Guidebook,Humana Press, Totowa,NJ,USA。
下面的术语用于描述2个或更多个多核苷酸或多肽之间的序列关系:(a)“参照序列,”(b)“对比窗,”(c)“序列同一性,”和,(d)“序列同一性百分比”。
(a)本文使用的“参照序列”是用作序列对比的基础的确定序列。参照序列可以是指定序列的子集或整体;例如,作为全长cDNA或基因序列的片段,或整个cDNA或基因序列。
(b)本文使用的“对比窗”指多核苷酸序列的邻接的和指定的片段,其中与用于2个多核苷酸的最佳比对的参照序列(不包含添加或缺失)相比,对比窗中的多核苷酸序列可以包含添加或缺失(即,缺口)。通常,对比窗的长度是至少约20个邻接核苷酸,且任选地可以是约30、约40、约50、约100、或更长。本领域技术人员理解,为了避免由于在多核苷酸序列中包含缺口而与参照序列的高相似性,通常导入缺口罚分,并从匹配数目中减去。
比对对比序列的方法是本领域众所周知的。因而,使用数学算法,可以确定任意2个序列之间的序列同一性百分比。这样的数学算法的非限制性实例是Myers和Miller(1988)CABIOS 4:11-17的算法;Smith等(1981)Adv.Appl.Math.2:482的局部比对算法;Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的全局比对算法;Pearson和Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的局部搜索比对方法;Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 872264的算法,如在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中所改进的。
这些数学算法的计算机实现,可以用于对比序列,以确定序列同一性。这样的实现包括,且不限于:PC/Gene程序中的CLUSTAL(可从Intelligenetics,Mountain View,California得到);ALIGN程序(2.0)和GCG Wisconsin Genetics软件包10版(可从AccelrysInc.,9685Scranton Road,San Diego,California,USA得到)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。使用默认参数,可以执行使用这些程序的比对。CLUSTAL程序详细记载在Higgins等(1988)Gene 73:237-244(1988);Higgins等(1989)CABIOS 5:151-153;Corpet等(1988)Nucleic Acid Res.16:10881-90;Huang等(1992)CABIOS 8: 155-65;和Pearson等(1994)Meth.Mol.Biol.24:307-331。ALIGN程序是基于上面Myers和Miller(1988)的算法。当对比氨基酸序列时,可以在ALIGN程序中使用PAM120加权残基表,缺口长度罚分为12,缺口罚分为4。Altschul等(1990)J.Mol.Biol.215:403的BLAST程序是基于上面Karlin和Altschul(1990)的算法。可以用BLASTN程序进行BLAST核苷酸搜索,评分=100,字长=12,以得到与编码实施方案蛋白的核苷酸序列同源的核苷酸序列。可以用BLASTX程序进行BLAST蛋白搜索,评分=50,字长=3,以得到与实施方案蛋白或多肽同源的氨基酸序列。为了得到用于对比目的的有缺口的比对,可以如Altschul等(1997)Nucleic Acid Res.25:3389所述使用有缺口的BLAST(在BLAST 2.0中)。或者,PSI-BLAST(在BLAST 2.0中)可以用于进行重复搜索,其检测分子之间的距离关系。参见Altschul等(1997)同上。当使用BLAST、有缺口的BLAST、PSI-BLAST时,可以使用各程序的默认参数(例如,对于核苷酸序列的BLASTN,对于蛋白的BLASTX)。参见www.ncbi.nlm.nih.gov。也可以通过目检,手工地进行比对。
除非另有说明,本文提供的序列同一性/相似性值指使用GAP 10版、使用下述参数得到的值:使用50的缺口权重和3的长度权重和nwsgapdna.cmp评分矩阵,核苷酸序列的%同一性和%相似性;使用8的缺口权重和2的长度权重和BLOSUM62评分矩阵,氨基酸序列的%同一性和%相似性;或其任意等价程序。“等价程序”是指,当与GAP10版生成的对应比对相对比时,对于任意2个正被讨论的序列,产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对的任意序列对比程序。
GAP使用Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的算法,以发现使匹配数最大化且使缺口数最小化的2个完整序列的比对。GAP考虑所有可能的比对和缺口位置,并产生具有最大数目的匹配碱基和最少缺口的比对。它允许提供以匹配碱基为单位的缺口产生罚分和缺口延伸罚分。对于插入的每个缺口,GAP必须利用缺口产生罚分匹配数。如果选择大于0的缺口延伸罚分,则GAP对于每个插入的缺口必须另外利用缺口长度乘以缺口延伸罚分。在GCGWisconsin Genetics软件包10版中,蛋白序列的默认缺口生成罚分值和缺口延伸罚分值分别是8和2。对于核苷酸序列,默认缺口生成罚分是50,而默认缺口延伸罚分是3。缺口生成和缺口延伸罚分可以表达为选自0-200的整数。因而,例如,缺口生成和缺口延伸罚分可以是0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。
GAP代表最佳比对家族的一个成员。该家族可以存在许多成员,且其它成员没有更好的品质。GAP表现出4个比对品质因数:品质、比率、同一性和相似性。品质是计量最大化的,以比对序列。比率是品质除以更短片段中的碱基数。百分比同一性是实际上匹配的符号的百分比。百分比相似性是相似的符号的百分比。忽略在缺口对面的符号。当一对符号的评分矩阵值大于或等于0.50(相似性阈值)时,评为相似性。在GCG Wisconsin Genetics软件包10版中使用的评分矩阵是BLOSUM62(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。
(c)在2个多核苷酸或多肽序列的上下文中,本文使用的“序列同一性”或“同一性”指,当比对指定对比窗中的最大一致性时,2个序列中相同的残基。当序列同一性百分比用于指蛋白时,公认的是,不同的残基位置的差异经常在于保守氨基酸置换,其中氨基酸残基被置换为具有类似化学性质(例如,电荷或疏水性)的其它氨基酸残基,且因此不改变该分子的功能性质。当序列差异在于保守置换时,可以向上调节百分比序列同一性,以改正置换的保守性质。据称差异在于这样的保守置换的序列具有“序列相似性”或“相似性”。进行该调节的方法,是本领域技术人员众所周知的。一般地,这包含将保守置换评分为部分的、而不是完全的错配,从而增加百分比序列同一性。因而,例如,当相同氨基酸评分为1、且非保守置换评分为0时,保守置换评分是在0-1之间。计算保守置换的评分,例如,如在程序PC/GENE(Intelligenetics,Mountain View,California)中所实现的。
(d)本文使用的“序列同一性百分比”指,通过在对比窗中对比2个最佳比对的序列测得的值,其中与用于2个序列的最佳比对的参照序列(不包含添加或缺失)相比,对比窗中的多核苷酸序列部分可以包含添加或缺失(即,缺口)。如下计算百分比:确定2个序列中存在相同核酸碱基或氨基酸残基的位置的数目,以得到匹配位置的数目,将 匹配位置的数目除以对比窗中的位置总数,并将结果乘以100,以得到序列同一性百分比。
术语“多核苷酸”的应用,无意将实施方案限制为包含DNA的多核苷酸。本领域技术人员将认识到,多核苷酸可以包含核糖核苷酸和核糖核苷酸和脱氧核糖核苷酸的组合。这样的脱氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成的类似物。实施方案的多核苷酸也包括序列的所有形式,包括但不限于单链形式、双链形式等。
实施方案的分离的多核苷酸可以整合入能导入宿主细胞并在其中复制的重组DNA构建体中。“载体”可以是这样的构建体,其包括复制系统和能在给定宿主细胞中转录和翻译多肽编码序列的序列。已经描述了适用于稳定转染植物细胞或确立转基因植物的许多载体,例如,Pouwels等,Cloning Vectors:A Laboratory Manual,1985,supp.1987;Weissbach和Weissbach,Methods for Plant Molecular Biology,Academic Press,1989;和Flevin等,Plant Molecular Biology Manual,Kluwer Academic Publishers,1990。一般地,植物表达载体包括,例如,在5′和3′调节序列和显性选择标记的转录控制下的一个或多个克隆的植物基因。这样的植物表达载体也可以含有启动子调节区(例如,控制诱导型或组成型、环境-或发育-调节的、或细胞-或组织-特异性的表达的调节区)、转录起始位点、核糖体结合位点、RNA加工信号、转录终止位点和/或多腺苷酸化信号。
术语“重组构建体”、“表达盒”、“表达构建体”、“嵌合构建体”、“构建体”、“重组DNA构建体”和“重组DNA片段”在本文中可互换地使用,且是核酸片段。重组构建体包含核酸片段的人工组合,包括且不限于,在自然界不一起发现的调节和编码序列。例如,重组DNA构建体可以包含源自不同来源的调节序列和编码序列,或源自相同来源且以与自然界发现的不同的方式排列的调节序列和编码序列。这样的构建体可以单独使用,或可以与载体结合使用。如果使用载体,则载体的选择依赖于用于转化宿主细胞的方法,如本领域技术人员众所周知的。例如,可以使用质粒载体。熟练的技术人员熟知必须存在于载体上的遗传元件,以成功地进行转化、选择和繁殖包含实施方案的任意分离的核酸片段的宿主细胞。通过扩增、DNA印迹分析、mRNA表达的RNA印迹分析、蛋白表达的免疫印迹分析、表型分析等,可以 进行筛选,以得到表现出多核苷酸或Rcg1基因座的所需表达水平和模式的系。
术语“重组DNA构建体”指由从不同来源获取的核酸片段装配而成的DNA构建体。核酸片段的类型和起源可以非常不同。
在有些实施方案中,另外提供了包含可操作地连接到实施方案的异源核苷酸序列上的启动子的表达盒。实施方案的表达盒可以用于生成转化的植物、植物细胞和微生物,及用于实施诱导本文公开的植物真菌病原体抗性的方法。表达盒包括可操作地连接到实施方案的多核苷酸上的5′和3′调节序列。“可操作地连接”意在指2个或更多个元件之间的功能连接。“调节序列”指位于编码序列的上游(5’非编码序列)、之内或下游(3’非编码序列)的核苷酸,且其可以影响相关编码序列的转录、RNA加工、稳定性或翻译。调节序列可以包括,但不限于,启动子、翻译前导序列、内含子和多腺苷酸化识别序列。例如,目标多核苷酸和调节序列(启动子,例如)之间的可操作连接是允许表达目标多核苷酸的功能连接。可操作地连接的元件可以是邻接的或非邻接的。当用于指2个蛋白编码区的连接时,可操作地连接的意指编码区是在相同读框中。表达盒可以另外含有至少一个要共转化进生物中的其它基因。或者,可以在多个表达盒上提供其它基因。这样的表达盒提供有多个限制位点和/或重组位点,用于插入在调节区的转录调节下的编码抗病原体多肽的多核苷酸。表达盒可以另外含有选择标记基因。
表达盒将在5′-3′转录方向包含转录起始区(即,启动子)、翻译起始区、实施方案的多核苷酸、翻译终止区和在宿主生物中起功能的任选的转录终止区。调节区(即,启动子、转录调节区和翻译终止区)和/或实施方案的多核苷酸对于宿主细胞而言或相互可以是天然的/类似的。或者,调节区和/或实施方案的多核苷酸可以是宿主细胞异源的或彼此异源的。本文使用的“异源的”序列是源自外来物种的序列,或者如果来自相同物种,则通过故意的人工干预,从它在组合物和/或基因组基因座中的天然形式进行相当大的修饰。例如,可操作地连接到异源多核苷酸上的启动子来自与多核苷酸所来源的物种不同的物种,或者如果来自相同/类似物种,则从它们的原始形式和/或基因组基因座相当大地修饰其中之一或二者,或者启动子不是可操作地连接的多核 苷酸的天然启动子。
任选地包含的终止区可以是对于转录起始区天然的,可以是对于可操作地连接的目标多核苷酸天然的,可以是对于植物宿主天然的,或可以源自启动子、目标多核苷酸、宿主或其任意组合的另一个来源(即,外来的或异源的)。方便的终止区可以从根癌土壤杆菌(A.tumefaciens)的Ti-质粒得到,例如,章鱼碱合酶和胭脂碱合酶终止区。也参见Guerineau等(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等(1991)Genes Dev.5:141-149;Mogen等(1990)Plant Cell 2:1261-1272;Munroe等(1990)Gene91:151-158;Ballas等(1989)Nucleic Acid Res.17:7891-7903;和Joshi等(1987)Nucleic Acid Res.15:9627-9639。在具体实施方案中,使用马铃薯蛋白酶抑制剂II基因(PinII)终止子。参见,例如,Keil等(1986)Nucl.Acids Res.14:5641-5650;和An等(1989)Plant Cell 1:115-122,它们在本文中整体引作参考。
许多启动子可以用于实践实施方案,包括目标多核苷酸序列的天然启动子。可以基于所需的结果来选择启动子。在本文引作参考的Potenza等(2004)In Vitro Cell DevBiol-Plant 40:1-22的最近的综述中,讨论了许多种植物启动子。例如,核酸可以与组成型、组织-优选的、病原体-诱导型或其它启动子相组合,以在植物中表达。这样的组成型启动子包括,例如,Rsyn7启动子的核心启动子,和在WO99/43838和美国专利号6,072,050中公开的其它组成型启动子;核心CaMV 35S启动子(Odell等(1985)Nature 313:810-812);稻肌动蛋白(McElroy等(1990)Plant Cell 2:163-171);遍在蛋白(Christensen等(1989)PlantMol.Biol.12:619-632和Christensen等(1992)PlantMol.Biol.18:675-689);pEMU(Last等(1991)Theor.Appl.Genet.81:581-588);MAS(Velten等(1984)EMBO J.3:2723-2730);ALS启动子(美国专利号5,659,026),等。其它组成型启动子包括,例如,美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611。
有时,从诱导型启动子、尤其从病原体-诱导型启动子表达基因有时是有益的。这样的启动子包括,来自致病相关蛋白(PR蛋白)的那些,它们在病原体感染后被诱导;例如,PR蛋白、SAR蛋白、β-1,3- 葡聚糖酶、几丁质酶等。参见,例如,Redolfi等(1983)Neth.J.PlantPathol.89:245-254;Uknes等(1992)Plant Cell 4:645-656;和VanLoon(1985)Plant Mol.Virol.4:111-116。也参见本文引作参考的WO99/43819。
令人感兴趣的是导致在病原体感染部位处或附近局部地表达蛋白的启动子。参见,例如,Marineau等(1987)Plant Mol.Biol.9:335-342;Matton等(1989)MolecularPlant-Microbe Interactions 2:325-331;Somsisch等(1986)Proc.Natl.Acad.Sci.USA83:2427-2430;Somsisch等(1988)Mol.Gen.Genet.2:93-98;和Yang(1996)Proc.Natl.Acad.Sci.USA 93:14972-14977。也参见,Chen等(1996)Plant J.10:955-966;Zhang等(1994)Proc.Natl.Acad.Sci.USA 91:2507-2511;Warner等(1993)Plant J.3:191-201;Siebertz等(1989)PlantCell 1:961-968;美国专利号5,750,386(线虫-诱导型);和其中引用的参考文献。特别令人感兴趣的是玉米PRms基因的诱导型启动子,它的表达由病原体串珠镰孢(Fusarium moniliforme)诱导(参见,例如,Cordero等(1992)Physiol.Mol.Plant Path.41:189-200)。
另外,随着病原体通过伤口或昆虫损伤进入植物,伤口-诱导型启动子可以用于实施方案的构建。这样的伤口-诱导型启动子包括马铃薯蛋白酶抑制剂(pin II)基因(Ryan(1990)Ann.Rev.Phytopath.28:425-449;Duan等(1996)Nature Biotechnology 14:494-498);wun1和wun2,美国专利号5,428,148;win1和win2(Stanford等(1989)Mol.Gen.Genet.215:200-208);系统素(McGurl等(1992)Science 225:1570-1573);WIP1(Rohmeier等(1993)Plant Mol.Biol.22:783-792;Eckelkamp等(1993)FEBS Letters 323:73-76);MPI基因(Corderok等(1994)Plant J.6(2):141-150);等,本文引作参考。
通过应用外源化学调节剂,可以将化学药品调节的启动子用于调节基因在植物中的表达。根据目的,启动子可以是化学药品-诱导型启动子(这时使用化学药品诱导基因表达)或化学药品-抑制型启动子(这时使用化学试剂阻抑基因表达)。化学药品-诱导型启动子是本领域已知的,并包括且不限于,玉米In2-2启动子,它由苯磺酰胺除草剂安全剂激活,玉米GST启动子,它由用作突出前(pre-emergent)除草剂的疏水亲电子化合物激活,和烟草PR-1a启动子,它由水杨酸激活。 其它化学药品调节的目标启动子包括类固醇-响应型启动子(参见,例如,Schena等(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425和McNellis等(1998)Plant J.14(2):247-257中的糖皮质激素-诱导型启动子)和四环素-诱导型和四环素-阻抑型启动子(参见,例如,Gatz等(1991) Mol.Gen.Genet.227:229-237,和美国专利号5,814,618和5,789,156),本文引作参考。
组织-优选的启动子可以用于在特定植物组织内靶定增强的实施方案的多肽的表达。例如,组织-优选的启动子可以用于在疾病抗性特别重要的植物组织(例如,根、茎或叶子)中表达多肽。组织-优选的启动子包括Yamamoto等(1997)Plant J.12(2):255-265;Kawamata等(1997)Plant Cell Physiol.38(7):792-803;Hansen等(1997)Mol.GenGenet.254(3):337-343;Russell等(1997)Thansgenic Res.6(2):157-168;Rinehart等(1996)Plant Physiol.112(3):1331-1341;VanCamp等(1996)PlantPhysiol.112(2):525-535;Canevascini等(1996)Plant Physiol.112(2):513-524;Yamamoto等(1994)Plant Cell Physiol.35(5):773-778;Lam(1994)Results Probl.CellDiffer.20:181-196;Orozco等(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka等(1993)Proc Natl.Acad.Sci.USA 90(20):9586-9590;和Guevara-Garcia等(1993)PlantJ.4(3):495-505。如果需要,可以修饰这样的启动子,进行弱表达。
维管组织-优选的启动子是本领域已知的,且包括选择性地驱动在例如木质部和韧皮部组织中的蛋白表达的那些启动子。维管组织-优选的启动子包括且不限于,野黑樱(Prunus serotina)的野黑樱苷水解酶基因启动子(参见,例如,国际公开号WO 03/006651),以及在美国专利申请系列号10/109,488中公开的那些。
茎-优选的启动子可以用于驱动实施方案多肽的表达。示例性的茎-优选的启动子包括玉米MS8-15基因启动子(参见,例如,美国专利号5,986,174和国际公开号WO 98/00533),和在Graham等(1997)Plant Mol Biol 33(4):729-735中公开的那些。
叶子-优选的启动子是本领域已知的。参见,例如,Yamamoto等(1997)Plant J.12(2):255-265;Kwon等(1994)Plant Physiol.105:357-67;Yamamoto等(1994)Plant CellPhysiol.35(5):773-778;Gotor 等(1993)Plant J.3:509-18;Orozco等(1993)PlantMol.Biol.23(6):1129-1138;和Matsuoka等(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590。
根-优选的启动子是已知的,且可以选自从文献可得到的或从各种相容物种从头分离的许多启动子。参见,例如,Hire等(1992)PlantMol.Biol.20(2):207-218(大豆根-特异性的谷氨酰胺合成酶基因);Keller和Baumgartner(1991)Plant Cell 3(10):1051-1061(菜豆的GRP1.8基因中的根-特异性的控制元件);Sanger等(1990)Plant Mol.Biol.14(3):433-443(根癌土壤杆菌的甘露碱合酶(MAS)基因的根-特异性的启动子);和Miao等(1991)Plant Cell 3(1):11-22(编码胞质谷氨酰胺合成酶(GS)的全长cDNA克隆,它在大豆根和根瘤中表达)。也参见Bogusz等(1990)Plant Cell 2(7):633-641,其中描述了2个分离自来自固氮非豆科植物糙叶山黄麻(Parasponia andersonii)和相关非固氮非豆科植物山黄麻(Trema tomentosa)的血红蛋白基因的根-特异性启动子。这些基因的启动子连接在β-葡糖醛酸糖苷酶报告基因上,并导入非豆科植物烟草(Nicotiana tabacum)和豆科植物百脉根(Lotuscorniculatus),且在2个实例中,保留了根-特异性的启动子活性。Leach和Aoyagi(1991)描述了他们对高度表达的发根土壤杆菌(Agrobacterium rhizogenes)的rolC和rolD根-诱导基因启动子的分析(参见Plant Science(Limerick)79(1):69-76)。他们认为,增强子和组织-优选的DNA决定子在那些启动子中分离。Teeri等(1989)使用与lacZ的基因融合来表明,编码章鱼碱合酶的土壤杆菌属(Agrobacterium)T-DNA基因在根尖表皮中是特别有活性的,TR2′基因在完整植物中是根特异性的,且受到叶子组织受伤的刺激,即与杀虫或杀幼虫基因一起使用的特征的特别所需的组合(参见EMBO J.8(2):343-350)。融合到nptII(新霉素磷酸转移酶II)上的TR1′基因表现出类似的特征。其它根-优选的启动子包括,VfENOD-GRP3基因启动子(Kuster等(1995)Plant Mol.Biol.29(4):759-772);和rolB启动子(Capana等(1994)Plant Mol.Biol.25(4):681-691。也参见美国专利号5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732;和5,023,179。
“种子-优选的”启动子包括“种子-特异性的”启动子(在种子发育 过程中有活性的那些启动子,例如种子贮藏蛋白的启动子)以及“种子-萌发”启动子(在种子萌发过程中有活性的那些启动子)。参见Thompson等(1989)BioEssays 10:108,本文引作参考。这样的种子-优选的启动子包括且不限于,Cim1(细胞分裂素-诱导的信使);cZ19B1(玉米19 kDa玉米醇溶蛋白);milps(肌醇-1-磷酸合酶)(参见WO 00/11177和美国专利号6,225,529;本文引作参考)。γ-玉米醇溶蛋白是优选的胚乳-特异性的启动子。Glob-1是一种优选的胚-特异性的启动子。对于双子叶植物,种子-特异性的启动子包括且不限于,豆β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白(conglycinin)、大豆凝集素、十字花科蛋白(cruciferin)等。对于单子叶植物,种子-特异性的启动子包括且不限于,玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、waxy、shrunken 1、shrunken2、球蛋白1等。也参见WO 00/12733,其中公开了来自end1和end2基因的种子-优选的启动子;本文引作参考。
已知其它序列修饰以增强细胞宿主中的基因表达。它们包括消除编码假多腺苷酸化信号的序列、外显子-内含子剪接位点信号、转座子-样重复和可能对基因表达有害的其它这样的确定表征的序列。可以将序列的G-C含量调节至给定细胞宿主的平均水平,这可以通过参考在宿主细胞中表达的已知基因来计算。当可行时,修饰序列,以避免预测的发夹二级mRNA结构。
表达盒可以另外含有5′前导序列。这样的前导序列可以起增强翻译的作用。翻译前导序列是本领域已知的,包括:小RNA病毒前导序列,例如,EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等(1989)Proc.Natl.Acad.Sci.USA 86:6126-6130);马铃薯Y病毒组前导序列,例如,TEV前导序列(烟草蚀斑病毒)(Gallie等(1995)Gene165(2):233-238),MDMV前导序列(玉米矮花叶病毒),和人免疫球蛋白重链结合蛋白(BiP)(Macejak等(1991)Nature 353:90-94);来自苜蓿花叶病毒外壳蛋白mRNA(AMV RNA 4)的非翻译前导序列(Jobling等(1987)Nature 325:622-625);烟草花叶病毒前导序列(TMV)(Gallie等(1989)in Molecular Biology of RNA,ed.Cech(Liss,New York),pp.237-256);和玉米褪绿斑驳病毒前导序列(MCMV)(Lommel等(1991)Virology 81:382-385)。也参见,Della-Cioppa等(1987)Plant Physiol.84:965-968。也可以使用已知增强翻译的其它方法,例如,内含子等。
在表达盒的制备中,可以操纵各种DNA片段,以便以正确方向,且在适宜时,在正确的读框中,提供DNA序列。为此目的,可以使用衔接头或接头来连接DNA片段,或可以包含其它操作,以提供方便的限制位点、去除多余的DNA、去除限制位点等。为此目的,可以包含体外诱变,引物修复,限制,退火,重新置换,例如,转换和颠换。
表达盒也可以包含用于选择转化细胞的选择标记基因。选择标记基因用于选择转化的细胞或组织。标记基因包括编码抗生素抗性的基因,例如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草剂化合物的抗性的基因,例如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)。其它选择标记包括表型标记,例如β-半乳糖苷酶和荧光蛋白,例如绿色荧光蛋白(GFP)(Su等(2004)Biotechnol Bioeng 85:610-9和Fetter等(2004)Plant Cell 16:215-28)、青色荧光蛋白(CYP)(Bolte等(2004)J.Cell Science 117:943-54和Kato等(2002)Plant Physiol 129:913-42)和黄色荧光蛋白(来自Evrogen的PhiYFPTM,参见,Bolte等(2004)J.Cell Science117:943-54)。关于其它选择标记,一般参见,Yarranton(1992)Curr.Opin.Biotech.3:506-511;Christopherson等(1992)Proc.Natl.Acad.Sci.USA 89:6314-6318;Yao等(1992)Cell 71:63-72;Reznikoff(1992)Mol.Microbiol.6:2419-2422;Barkley等(1980)in The Operon,pp.177-220;Hu等(1987)Cell 48:555-566;Brown等(1987)Cell 49:603-612;Figge等(1988)Cell 52:713-722;Deuschle等(1989)Proc.Natl.Acad.Aci.USA 86:5400-5404;Fuerst等(1989)Proc.Natl.Acad.Sci.USA 86:2549-2553;Deuschle等(1990)Science 248:480-483;Gossen(1993)Ph.D.Thesis,University of Heidelberg;Reines等(1993)Proc.Natl.Acad.Sci.USA 90:1917-1921;Labow等(1990)Mol.Cell.Biol.10:3343-3356;Zambretti等(1992)Proc.Natl.Acad.Sci.USA89:3952-3956;Baim等(1991)Proc.Natl.Acad.Sci.USA 88:5072-5076;Wyborski等(1991)Nucleic Acid Res.19:4647-4653;Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10:143-162; Degenkolb等(1991)Antimicrob.Agents Chemother.35:1591-1595;Kleinschnidt等(1988)Biochemistry 27:1094-1104;Bonin(1993)Ph.D.Thesis,University of Heidelberg;Gossen等(1992)Proc.Natl.Acad.Sci.USA 89:5547-5551;Oliva等(1992)Antimicrob.Agents Chemother.36:913-919;Hlavka等(1985)Handbook ofExperimentalPharmacology,Vol.78(Springer-Verlag,Berlin);Gill等(1988)Nature334:721-724。这些公开内容在本文中引作参考。
上面的选择标记基因列表不是限制性的。在实施方案中可以使用任意的选择标记基因。
可以将实施方案的基因表达为转基因,以使植物抗Cg。使用本文别处所述的不同启动子,将允许在不同环境中以受调节的形式表达。例如,人们可能希望在茎中更高水平的表达,以增强对Cg-造成的茎腐烂的抗性。在Cg-造成的叶斑病是严重问题的情况下,可以使用在叶子中具有更高表达水平的系。但是,人们也可以插入整个基因(天然启动子和编码序列)作为转基因。最后,使用实施方案的基因作为转基因,将允许与其它特性(例如昆虫或除草剂抗性)快速组合。
在某些实施方案中,可以将实施方案的核酸序列与目标多核苷酸序列的任意组合相堆叠,以生成具有所需表型的植物。该堆叠可以如下实现:通过DNA构建体内基因的组合,或通过使Rcg1与包含该组合的另一个系杂交。例如,实施方案的多核苷酸可以与实施方案的任意其它多核苷酸或其它基因相堆叠。产生的组合也可以包括目标多核苷酸中的任一个的多个拷贝。实施方案的多核苷酸也可以与任意其它基因或基因组合相堆叠,以生产具有许多所需的性状组合的植物,所述性状包括、且不限于下述物质需要的性状:动物饲料例如高油基因(例如,美国专利号6,232,529);平衡的氨基酸(例如hordothionins(美国专利号5,990,389;5,885,801;5,885,802;和5,703,409);大麦高赖氨酸(Williamson等(1987)Eur.J.Biochem.165:99-106;和WO98/20122);和高甲硫氨酸蛋白(Pedersen等(1986)J.Biol.Chem.261:6279;Kirihara等(1988)Gene 71:359;和Musumura等(1989)PlantMol.Biol.12:123));增加的可消化性(例如,改良的贮藏蛋白(2001年11月7日提交的美国申请系列号10/053,410);和硫氧还蛋白(2001年12月3日提交的美国申请系列号10/005,429)),它们 的公开内容在本文引作参考。实施方案的多核苷酸也可以与昆虫、疾病或除草剂抗性需要的性状相堆叠(例如,苏云金芽孢杆菌(Bacillusthuringiensis)毒蛋白(美国专利号5,366,892;5,747,450;5,737,514;5723,756;5,593,881;Geiser等(1986)Gene 48:109);凝集素(VanDamme等(1994)Plant Mol.Biol.24:825);串珠镰孢菌素解毒基因(美国专利号5,792,931);毒力和疾病抗性基因(Jones等(1994)Science266:789;Martin等(1993)Science 262:1432;Mindrinos等(1994)Cell 78:1089);导致除草剂抗性的乙酰乳酸合酶(ALS)突变体,例如S4和/或Hra突变;谷氨酰胺合酶抑制剂,例如膦丝菌素或草铵膦(例如,bar基因);和草甘膦抗性(EPSPS基因、GAT基因,例如在美国专利申请公开US2004/0082770、以及WO02/36782和WO03/092360中公开的那些));和与下述内容需要的性状相堆叠:加工或处理产物例如高油(例如,美国专利号6,232,529);改良油(例如,脂肪酸去饱和酶基因(美国专利号5,952,544;WO 94/11516));改性淀粉(例如,ADPG焦磷酸化酶(AGP酶)、淀粉合酶(SS)、淀粉分支酶(SBE)和淀粉脱支酶(SDBE));和聚合物或生物塑料(bioplastics)(例如,美国专利号5.602,321;β-酮硫解酶、聚羟基丁酸盐合酶和乙酰乙酰辅酶A还原酶(Schubert等(1988)J.Bacteriol.170:5837-5847)促进聚羟基链烷酸酯(PHA)的表达),它们的公开内容在本文引作参考。人们也可以将实施方案的多核苷酸与提供农艺学性状(例如雄性不育(例如,参见美国专利号5.583,210)、茎强度、开花时间)或转化技术性状(例如细胞周期调节或基因打靶(例如WO 99/61619;WO 00/173 64;WO 99/25821))的多核苷酸相组合,它们的公开内容在本文引作参考。
这些堆叠组合可以通过下述任意方法来生成:包括且不限于,通过任意常规的或TopCross方法或遗传转化,杂交育种植物。如果通过遗传转化植物堆叠性状,则可以在任意时间且以任意次序组合目标多核苷酸序列。例如,可以将包含一个或多个所需性状的转基因植物用作通过随后的转化导入其它性状的靶。在共转化方案中,可以与转化盒的任意组合提供的目标多核苷酸同时导入性状。例如,如果将导入2个序列,则2个序列可以包含在分开的转化盒中(反式)或包含在相同转化盒中(顺式)。序列的表达可以由相同启动子或不同启动子驱动。在某些情况下,可能需要导入将抑制目标多核苷酸的表达的转化 盒。这可以与其它抑制盒或超表达盒的任意组合相组合,以在植物中生成所需的性状组合。
实施方案的方法可以包含,且不限于,向植物中导入多肽或多核苷酸。“导入”意在指向植物呈递该多核苷酸。在有些实施方案中,多核苷酸的呈递方式使得该序列能进入植物细胞内部,包括它向植物基因组中的潜在插入。实施方案的方法不依赖于向植物中导入序列的具体方法,只是多核苷酸能进入至少一个植物细胞内部。向植物中导入多核苷酸的方法是本领域已知的,包括且不限于,稳定转化方法、瞬时转化方法和病毒介导的方法。
“转化”指核酸片段向宿主生物基因组中的转移,从而导致遗传稳定的遗传。含有转化的核酸片段的宿主生物称作“转基因”生物。“宿主细胞”指其中发生重组DNA构建体的转化的细胞,且可以包括酵母细胞、细菌细胞和植物细胞。植物转化的方法的实例除了别的以外包括土壤杆菌属-介导的转化(De Blaere等,1987,Meth.Enzymol.143:277)和颗粒-加速的或“基因枪”转化技术(Klein等,1987,Nature(London)327:70-73;美国专利号4,945,050)。
“稳定转化”意在指,导入植物中的核苷酸构建体整合进植物基因组中,且能被其后代遗传。“瞬时转化”或“瞬时表达”意在指,多核苷酸被导入植物中,但不整合进植物基因组中,或多肽被导入植物中。
转化方案以及向植物中导入多肽或多核苷酸序列的方案可以随被靶定用于转化的植物或植物细胞(即,单子叶植物或双子叶植物)类型而异。合适的向植物细胞中导入多肽和多核苷酸的方法包括显微注射(Crossway等(1986)Biotechniques 4:320-334)、电穿孔(Riggs等(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606、土壤杆菌属-介导的转化(美国专利号5,563,055和5,981,840)、直接基因转移(Paszkowski等(1984)EMBO J.3:2717-2722)和冲击颗粒加速(参见,例如,Sanford等,美国专利号4,945,050;5,879,918;5,886,244;和5,932,782;Tomes等(1995)in Plant Cell,Tissue,and Organ Culture:FundamentalMethods,ed.Gamborg和Phillips(Springer-Verlag,Berlin);McCabe等(1988)Biotechnology 6:923-926);和Lec1转化(WO 00/28058)。也参见,Weissinger等(1988)Ann.Rev.Genet.22:421-477;Sanford等 (1987)Particulate Science andTechnology 5:27-37(洋葱);Christou等(1988)Plant Physiol.87:671-674(大豆);McCabe等(1988)Bio/Technology 6:923-926(大豆);Finer和McMullen(1991)InVitroCell Dev.Biol.27P:175-182(大豆);Singh等(1998)Theor.Appl.Genet.96:319-324(大豆);Datta等(1990)Biotechnology 8:736-740(稻);Klein等(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309(玉米);Klein等(1988)Biotechnology6:559-563(玉米);美国专利号5,240,855;5,322,783和5,324,646;Klein等(1988)PlantPhysiol.91:440-444(玉米);Fromm等(1990)Biotechnology 8:833-839(玉米);Hooykaas-Van Slogteren等(1984)Nature(London)311:763-764;美国专利号5,736,369(谷类);Bytebier等(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(百合科(Liliaceae));De Wet等(1985)in TheExperimental Manipulation of Ovule Tissues,ed.Chapman等(Longman,New York),pp.197-209(花粉);Kaeppler等(1990)PlantCell Reports 9:415-418和Kaeppler等(1992)Theor.Appl.Genet.84:560-566(whisker-介导的转化);D′Halluin等(1992)Plant Cell 4:1495-1505(电穿孔);Li等(1993)Plant Cell Reports12:250-255和Christou和Ford(1995)Annals of Botany 75:407-413(稻);Osjoda等(1996)Nature Biotechnology 14:745-750(玉米经由根癌土壤杆菌);它们都在本文引作参考。
在植物基因组的特定位置靶向插入多核苷酸的方法是本领域已知的。在一个实施方案中,使用位点-特异性的重组系统,实现在所需基因组位置的多核苷酸的插入。参见,例如,WO99/25821、WO99/25854、WO99/25840、WO99/25855和WO99/25853,它们都在本文引作参考。简而言之,实施方案的多核苷酸可以包含在侧接2个不相同的重组位点的转移盒中。将转移盒导入植物,该植物已经在它的基因组中稳定地整合了靶位点,后者侧接与转移盒的位点相对应的2个不相同的重组位点。提供适当的重组酶,并将转移盒整合在靶位点。因此,将目标多核苷酸整合在植物基因组的特定染色体位置。
根据常规方式,可以使已经转化的细胞在植物中生长。参见,例如,McCormick等(1986)Plant Cell Reports 5:81-84。这些植物然后可以生长,用相同的转化品系或不同品系授粉,且产生的后代具有所 需的鉴别出的表型特征的组成型表达。可以生长2代或更多代,以确保稳定地维持和遗传所需表型特征的表达,然后收获种子,以确保已经实现所需表型特征的表达。以此方式,实施方案提供了转化的种子(也称作“转基因种子”),其具有稳定地整合入它们的基因组中的实施方案的核苷酸构建体,例如,实施方案的表达盒。
本文使用的术语“植物”可以是完整植物、其任意部分、或源自植物的细胞或组织培养物。因而,术语“植物”可以指下述任一种:完整植物、植物组分或器官(包括但不限于胚、花粉、胚珠、种子、叶子、花、枝、果实、核、谷穗、穗轴、外壳、茎、根、根尖、花药等)、植物组织、植物细胞、植物原生质体、可以再生玉米植物的植物细胞组织培养物、植物愈伤组织、植物块和植物种子。植物细胞是直接取自种子或植物、或通过培养取自植物的细胞产生的植物的细胞。谷粒意在指商业种植者为了生长或繁殖物种以外的目的而生产的成熟种子。再生的植物的后代、变体和突变体也包括在实施方案范围内,前提是,这些部分包含导入的多核苷酸。
本发明实施方案可以用于赋予或增强真菌植物病原体抗性,或保护植物、尤其玉米(玉蜀黍)免受真菌病原体攻击。它可以保护植物的不同部分免受病原体攻击,包括且不限于茎、谷穗、叶子、根和雄花穗。在实践本发明实施方案中,其它植物物种也具有重要性,包括且不限于,其它单子叶农作物植物。
在适当时,可以最优化多核苷酸,以在转化的生物中增加表达。例如,使用提高表达的植物-优选的密码子,可以合成多核苷酸。关于宿主-优选的密码子选择的讨论,参见,例如,Campbell和Gowri(1990)Plant Physiol.92:1-11。在本领域可以得到用于合成植物-优选的基因的方法。参见,例如,美国专利号5,380,831和5,436,391,和Murray等(1989)Nucleic Acid Res.17:477-498,本文引作参考。
本发明实施方案可以有效地抗多种植物病原体,尤其真菌病原体,例如,毛盘孢属,包括Cg。本发明实施方案也可以有效地抗玉米茎腐烂,包括炭疽病茎腐烂,其中病原体是毛盘孢属。其它植物病原性真菌和卵菌(后者中的许多在历史上已经被视作真菌,尽管现代分类学家现在已经将它们单独分类)包括且不限于,下述的:大豆:大雄疫霉(Phytophthora megasperma)fsp.glycinea、菜豆大壳球孢 (Macrophomina phaseolina)、茄属丝核菌(Rhizoctonia solani)、油菜核盘菌(Sclerotinia sclerotiorum)、尖孢镰孢(Fusarium oxysporum)、Diaporthe phaseolorum var.sojae(大豆拟茎点霉(Phomopsissojae))、Diaporthe phaseolorum var.caulivora、整齐小核菌(Sclerotiumrolfsii)、菊池尾孢(Cercospora kikuchii)、大豆尾孢(Cercosporasojina)、东北霜霉(Peronosporamanshurica)、束状毛盘孢(Colletotichum dematium)(平头毛盘孢(Colletotichumtruncatum))、山扁豆生棒孢(Corynespora cassiicola)、大豆壳针孢(Septoriaglycine)、大豆生叶点霉(Phyllosticta sojicola)、互格链格孢(Alternariaalternata)、扩散叉丝壳(Microsphaera diffusa)、半裸镰孢(Fusariumsemitectum)、Phialophora gregata、大豆炭疽病霉(Glomerellaglycine)、豆薯层锈菌(Phakopsora pachyrhizi)、瓜果腐霉(Pythiumaphanidermatum)、终极腐霉(Pythium ultimum)、德巴利氏腐霉(Pythiumdebaryanum)、茄病镰孢(Fusarium solani);低芥酸菜子:蔬菜白锈菌(Albugo candida)、甘蓝黑斑病链格孢(Alternariabrassicae)、Leptosphaeria maculans、茄属丝核菌、油菜核盘菌、芸苔生球腔菌(Mycosphaerella brassiccola)、终极腐霉、寄生霜霉(Peronosporaparasitica)、玫瑰色镰孢(Fusarium roseum)、互格链格孢;苜蓿:终极腐霉、畸雌腐霉(Pythium irregulare)、华丽腐霉(Pythium splendens)、德巴利氏腐霉、瓜果腐霉、大雄疫霉、车轴草霜霉(Peronospora trifoliorum)、Phoma medicaginis var.medicaginis、苜蓿尾孢(Cercospora medicaginis)、苜蓿假盘菌(Pseudopeziza medicaginis)、Leptotrochila medicaginis、尖孢镰孢、棉黄萎轮枝孢(Verticillium albo-atrum)、根腐丝囊霉(Aphanomyceseuteiches)、Stemphylium herbarum、Stemphylium alfalfae、三叶草毛盘孢(Colletotrichum trifolii)、Leptosphaerulina briosiana、条纹单胞锈菌(Uromyces striatus)、三叶草核盘菌(Sclerotinia trifoliorum)、Stagnosporameliloti、葡萄串状葡柄霉(Stemphylium botryosum)、Leptotrochila medicaginis;小麦:冰草条黑粉菌(Urocystis agropyri)、互格链格孢、腊叶枝孢(Cladosporiumherbarum)、禾谷镰孢(Fusariumgraminearum)、燕麦镰孢(Fusarium avenaceum)、大刀镰孢(Fusariumculmorum)、大麦散黑粉菌(Ustilago tritici)、Ascochyta tritici、禾 谷头孢(Cephalosporium gramineum)、禾生毛盘孢、禾白粉菌(Erysiphegraminis)f.sp.tritici、禾柄锈菌(Puccinia graminis)f.sp.tritici、隐匿柄锈菌(Puccinia recondita)f.sp.tritici、条形柄锈菌(Pucciniastriiformis)、偃麦草核腔菌(Pyrenophoratritici-repentis)、颖枯壳针孢(Septoria nodorum)、小麦壳针孢(Septoria tritici)、Septoriaavenae、Pseudocercosporella herpotrichoides、茄属丝核菌、禾谷丝核菌(Rhizoctonia cerealis)、禾顶囊壳(Gaeumannomyces graminis)var.tritici、瓜果腐霉、强雄腐霉(pythium arrhenomanes)、终极腐霉、麦根腐离蠕孢(Bipolaris sorokiniana)、紫癜麦角菌(Clavicepspurpurea)、小麦网腥黑粉菌(Tilletia tritici)、深蓝腥黑粉菌(Tilletialaevis)、大麦散黑粉菌、印度腥黑粉菌(Tilletia indica)、茄属丝核菌、强雄腐霉(Pythium arrhenomannes)、Pythium gramicola、瓜果腐霉;向日葵:Plasmophorahalstedii、油菜核盘菌、向日葵壳针孢( Septoria helianthi)、Phomopsis helianthi、Alternaria helianthi、百日草链格孢(Alternaria zinniae)、灰色葡萄孢(Botrytiscinerea)、Phoma macdonaldii、菜豆大壳球孢、二孢白粉菌(Erysiphecichoracearum)、米根霉(Rhizopus oryzae)、无根根霉(Rhizopusarrhizus)、匍枝根霉(Rhizopusstolonfer)、向日葵柄锈菌(Pucciniahelianthi)、大丽花轮枝孢(Verticilliumdahliae)、Erwinia carotovorumpv.Carotovora、枝顶头孢(Cephalosporiumacremonium)、隐地疫霉(Phytophthora cryptogea)、Albugo tragopogonis;玉米:串珠镰孢var.subglutinans、斯获氏欧文氏杆菌(Erwinia stewartii)、串珠镰孢、玉蜀黍赤霉(Gibberella zeae)(禾谷镰孢)、Stenocarpella maydi(Diplodia maydis)、畸雌腐霉、德巴利氏腐霉、禾生腐霉(Pythiumgraminicola)、华丽腐霉、终极腐霉、瓜果腐霉、黄色曲霉(Aspergillusflavus)、Bipolaris maydis O,T(异纹旋孢霉(Cochliobolusheterostrophus))、炭色长蠕孢(Helminthosporium carbonum)I,II &III(Cochliobolus carbonum)、Exserohilum turcicum I,II & III、Helminthosporiumpedicellatum、玉蜀黍节壶菌(Physoderma maydis)、Phyllosticta maydis、Kabatiellamaydis、高粱尾孢(Cercospora sorghi)、玉蜀黍黑粉菌(Ustilago maydis)、高粱柄锈菌(Puccinia sorghi)、多堆柄锈菌(Puccinia polysora)、菜豆大壳球孢、草酸青霉(Penicillium oxalicum)、稻黑孢(Nigrospora oryzae)、腊叶枝孢、新月弯孢(Curvularialunata)、不等弯孢(Curvularia inaequalis)、苍白弯孢(Curvularia pallescens)、绿色木霉(Trichoderma viride)、Clavicepssorghi、菊欧文氏杆菌(Erwinia chrysanthemi)pv.zea、胡萝卜欧文氏杆菌(Erwinia carotovora)、大孢色二孢(Diplodia macrospora)、大孢指疫霉(Sclerophthora macrospora)、高粱指霜霉(Peronosclerospora sorghi)、菲律宾指霜霉(Peronosclerosporaphilippinensis)、Peronosclerospora maydis、Peronosclerosporasacchari、高粱轴黑粉菌(Sphacelotheca reiliana)、Physopellazeae、Cephalosporium maydis、枝顶头孢;高粱:Exserohilum turcicum、禾生毛盘孢(Glomerella graminicola)、高粱尾孢、高粱胶尾孢(Gloeocercospora sorghi)、高粱生壳二孢(Ascochyta sorghina)、紫色柄锈菌(Puccinia purpurea)、菜豆大壳球孢、Perconiacircinata、串珠镰孢、互格链格孢、高梁生平脐蠕孢(Bipolaris sorghicola)、Helminthosporium sorghicola、新月弯孢、Phoma insidiosa、高粱座枝孢(Ramulisporasorghi)、高粱生座枝孢(Ramulispora sorghicola)、甘蔗黑痣菌(Phyllacharasacchari)、Sporisorium reilianum(高粱轴黑粉菌)、高粱轴黑粉菌(Sphacelothecacruenta)、Sporisorium sorghi、Claviceps sorghi、茄属丝核菌、Acremonium strictum、大孢指疫霉(Sclerophthona macrospora)、高粱指霜霉、菲律宾指霜霉、禾生指根霉(Sclerospora graminicola)、禾谷镰孢、尖孢镰孢、强雄腐霉、禾生腐霉等。
“种质”指个体(例如,植物)、一组个体(例如,植物系、品种或家族),或从系、品种、物种或培养物衍生的克隆的遗传材料,或来自它们的遗传材料。种质可以是生物或细胞的部分,或可以分离自生物或细胞。一般而言,种质提供具有特定分子组成的遗传材料,后者提供生物或细胞培养物的一些或全部遗传品质的物理基础。本文使用的种质包括可以生长成新植物的细胞、种子或组织,或可以培养成完整植物的植物部分,例如叶子、茎、花粉或细胞。
术语“等位基因”指在特定基因座中产生的2个或更多个不同核苷酸序列之一。第一个等位基因见于一个染色体上,而第二个等位基因存在于那个染色体的同源物的相同位置处,例如,存在于杂合个体的 不同染色体上,或在群体的不同纯合或杂合个体之间。“有利的等位基因”是赋予或有助于农艺学需要的表型(例如,对Cg感染的抗性)的特定基因座处的等位基因。有利的标记等位基因是与有利表型一起分离的标记等位基因。有利的等位基因形式的染色体区段是,在物理地位于染色体区段上的一个或多个遗传基因座处包含有助于优秀农艺学性能的核苷酸序列的染色体区段。“等位基因频率”指群体、或系的群体内的等位基因的频率(比例或百分比)。人们通过平均来自该群体的个体样本的等位基因频率,可以估计群体内的等位基因频率。
当等位基因与性状相连锁、且等位基因的存在指示着所需的性状或性状形式将存在于包含该等位基因的植物中时,等位基因“阳性地”与性状相关联。当等位基因与性状相连锁、且等位基因的存在指示着所需的性状或性状形式将不存在于包含该等位基因的植物中时,等位基因“阴性地”与性状相关联。
如果个体在给定基因座处仅仅具有一种类型的等位基因,则该个体是“纯合的”(例如,二倍体个体在2个同源染色体中的每一个的基因座处具有相同等位基因的一个拷贝)。如果个体在给定基因座处存在超过一个等位基因类型,则该个体是“杂合的”(例如,具有2个不同等位基因中的每一个的一个拷贝的二倍体个体)。杂合情形的特殊情况是这样的,其中一个染色体具有基因的等位基因,而另一个染色体完全缺少该基因、基因座或区域--换而言之,相对于第一个染色体具有缺失。该情形称作“半合子的”。术语“同质性”指,一组中的成员在一个或多个特定基因座处基因型。相反地,术语“异质性”用于指,一组中的个体在一个或多个特定基因座处基因型不同。
实施方案不仅提供了用于转基因应用的基因和它的功能变体,而且提供了允许使用标记辅助育种来在玉米系之间移动Rcg1抗性基因的序列和方法。实施方案也涉及这些方法生产的植物,它们保持包含Rcg1抗性基因的截短的染色体区间。
遗传学图是基因组(或基因组的部分,例如单个染色体)的图解表示,其中通过界标之间的重组频率,测量染色体上界标之间的距离。使用在本文更详细描述的许多分子遗传标记(也称作分子标记),可以检测遗传界标之间的重组。
关于用于检测重组的标记,它们需要检测待监控的群体内的差异 或多态性。关于分子标记,这意味着由于多核苷酸序列差异(例如SSR、RFLPs、FLPs、SNP)造成的DNA水平的差异。基因组变异性可以来自任意来源,例如,插入、缺失、重复、重复元件、点突变、重组事件或转座因子的存在和序列。分子标记可以源自基因组或表达的核酸(例如,ESTs)。ESTs通常在物种内是非常保守的,而DNA的其它区域(通常非编码)倾向于积累多态性,且因此,可以在相同物种的个体之间更可变。大量玉米分子标记是本领域已知的,且是公开的,或可以从各种来源得到,例如Maize GDB互联网资源和Universityof Arizona管理的亚利桑那州基因组研究所(Arizona GenomicsInstitute)互联网资源。
分子标记可以用于许多植物育种应用(例如参见Staub等(1996)IIortscience31:729-741;Tanksley(1983)Plant Molecular BiologyReporter.1:3-8)。主要目标领域之一是提高使用标记辅助选择(MAS)回交和渐渗基因的效率。证实了与影响所需表型性状的基因座的连锁的分子标记,提供用于选择植物群体的性状的有用工具。当表型难以测定时,例如许多疾病抗性性状,或发生在植物发育的晚期,例如核特征,这尤其是正确的。由于与田地表型测定相比,DNA标记测定费力更少,且需要更小的物理空间,所以可以测定大的多的群体,从而增加发现含有转移到受体系的来自供体系的靶区段的重组体的机会。连锁越紧密,标记越有用,因为重组不太可能发生在标记和造成性状的基因之间,这可以产生假阳性。具有侧接标记减少发生假阳性选择的机会,因为将需要双重组事件。理想的情况是,在基因本身中具有标记,从而使得标记和基因之间不会发生重组。这样的标记称作‘完美标记’。
当基因被MAS渐渗时,不仅导入了该基因,而且导入了侧接区(Gepts.(2002).CropSci; 42:1780-1790)。这称作“连锁拖曳”。在供体植物与受体植物高度不相关的情况下,如在从MP305(外来来源)向原种近交中渐渗Rcg1基因座的情况下,这些侧接区携带可以编码农艺学上不需要的性状的其它基因。该“连锁拖曳”也可以导致降低的产量或其它负面农艺学特征,甚至在回交进原种玉米系多个周期后。这有时也称作“产量拖曳”。通过其它回交,可以减少侧接区的大小,尽管这不会总成功,因为育种者不能控制该区域的大小或重组断裂点 (Young等(1998)Genetics 120:579-585)。在经典的育种中,通常仅仅偶然选择重组,这有助于减小供体区段的大小(Tanksley等(1989)。Biotechnology 7:257-264)。甚至在这类回交中20次回交后,人们可以预期发现仍然与要选择的基因连锁的相当大的供体染色体片。但是,使用标记可能选择在目标基因附近已经经历重组的那些罕见的个体。在150株回交植物中,至少一株植物将经历1cM基因内的交换的机会是95%,这基于单减数分裂图距。标记也允许明确地鉴别那些个体。利用300株植物的另外一次回交,在基因另一侧的1cM单减数分裂图距内的交换的机会是95%,从而产生在小于2cM的靶基因周围的区段,这基于单减数分裂图距。这可以在含有标记的2代中完成,同时平均需要没有标记的100代(参见Tanksley等,同上)。当已知基因的准确位置时,可以使用在该基因周围的一系列侧接标记,来选择不同群体大小的重组。例如,可以预见更小的群体大小中重组进一步远离该基因,所以需要更远侧的侧接标记来检测重组。
含有增加密度的公开可得玉米标记的玉米基因组的综合连锁图的可用性,已经促进了玉米遗传作图和MAS。参见,例如IBM2相邻4图[在线],[在2006-03-21检索]。从因特网检索:<URL:http://www.maizegdb.org/cgi-bin/displaymaprecord.cgi?id=871214>
执行MAS的关键组分是:(i)定义其中可以测定标记-性状关联的群体,它可以是分离群体,或随机的或结构化的群体;(ii)监控多态标记相对于性状的分离或结合,和使用统计学方法,确定连锁或关联;(iii)基于统计学分析的结果,定义一组需要的标记;和(iv)使用和/或外推该信息到现有的育种种质集合,以实现基于标记的选择决定。在本公开内容中所述的3类标记可以用于标记辅助选择方案;简单序列重复(SSR,也称作微卫星)标记、单核苷酸多态性(SNP)标记和片段长度多态(FLP)标记。SSR可以定义为相对短的长度为6bp或更小的串联重复DNA串(Tautz(1989)Nucleic Acid Research 17:6463-6471;Wang等(1994)Theoretical and Applied Genetics,88:1-6)。多态性产生的原因是重复单元数目的变化,可能由DNA复制过程中的滑动造成(Levinson和Gutman(1987)Mol Biol Evol 4:203-221)。通过设计保守的非重复侧接区的PCR引物,可以检测重复长度的变化(Weber和May(1989)Am J Hum Genet 44:388-396)。SSR非 常适用于作图和MAS,因为它们是多等位基因的、共显性的、可重复的且顺从高通量自动化的(Rafalski等(1996)Generating andusingDNA markers in plants。见:Non-mammalian genomic analysis:apracticalguide.Academic press.pp 75-135)。
例如,在本文的实施例5中提供了MP305的SSR标记特性(profile)。通过这些标记的引物对产生的扩增产物的凝胶电泳,产生该标记特性。标记基因型的评分是基于扩增片段的大小,在该情况下其通过片段的碱基对权重来测量。尽管使用的引物或实验室操作中的变化会影响报道的碱基对权重,相对值将保持恒定,而不管使用的具体引物或实验室。因而,当对比系时,对比的SSR性状应当从相同实验室获取,以便使用相同的引物和装置。为此原因,当关于特定标记来对比植物或系时,优选地说明这样的植物或系在特定基因座处具有相同的(或不同的)等位基因(例如人们可以声称,如果植物在UMC15a处或下边不包含MP305衍生的染色体区间,则它将在实施例5的表6列出的UMC15a处或下边的所有基因座处不包含与MP305相同的等位基因)。在DNA Landmarks in Saint-Jean-sur-Richelieu,Quebec,Canada合同(contractual)基础上,公众可以得到玉米的SSR服务。
可以产生各种类型的FLP标记。最常见地,使用扩增引物来产生片段长度多态性。这样的FLP标记在许多方面类似于SSR标记,例外是,该引物扩增的区域通常不是高度重复区域。另外,扩增的区域或扩增子在种质中将具有足够的变异性,这经常是由于插入或缺失,从而可以在多态的个体中区分扩增引物产生的片段,且已知这样的插入/缺失经常发生在玉米中(Bhattramakki等(2002).Plant Mol Biol 48,539-547;Rafalski(2002b),同上)。术语“插入/缺失”指插入或缺失,其中一个系可以称作相对于第二个系具有插入,或第二个系可以称作相对于第一个系具有缺失。本文公开的MZA标记是已经选择的扩增的FLP标记的实例,因为它们与Rcg1基因非常接近。
SNP标记检测单碱基对核苷酸置换。在所有分子标记类型中,SNP是最丰富的,因而具有提供最高遗传学图分辨率的潜力(Bhattramakki等2002 Plant Molecular Biology48:539-547)。可以在甚至比SSR更高水平的通量,以所谓的‘超高通量’方式,测定SNP, 因为它们不需要大量的DNA,且测定的自动化可以是简单的。SNP也具有相对低成本系统的前景。这3个因素一起使得SNP在MAS中的应用非常有吸引力。可以得到几种SNP基因型分析的方法,包括但不限于,杂交、引物延伸、寡核苷酸连接、核酸酶切割、微测序(minisequencing)和编码的球。这样的方法的综述见:Gut(2001)HumMutat 17pp.475-492;Shi(2001)Clin Chem 47,pp.164-172;Kwok(2000)Pharmacogenomics 1,pp.95-100;Bhattramakki和Rafalski(2001)Discovery and application of single nucleotidepolymorphismmarkers in plants。见:R.J.Henry,Ed,Plant Genetyping:TheDNAFingerprinting of Plants,CABI Publishing,Wallingford。许多可商业得到的技术使用这些和其它方法来查询SNP,包括MasscodeTM(Qiagen),Invader(Third WaveTechnologies ),SnapShot(Applied Biosystems),Taqman(Applied Biosystems)和BeadarraysTM(Illumina)。
在序列内或跨连接的序列的许多SNP一起可以用于描述任意特定基因型的单元型(Ching等(2002),BMC Genet.3:19pp Gupta等2001,Rafalski(2002b),同上)。单元型可以比单个SNP更有信息量,且更能描述任意特定基因型。例如,单SNP可以是MP305的等位基因‘T’,但是等位基因‘T’也可能发生在用于回归亲本的玉米育种群体中。在该情况下,单元型,例如在连锁的SNP标记处的一系列等位基因,可以更有信息量。一旦已经将独特的单元型分配给供体染色体区域,则该单元型可以用于群体或其任意子集中,以确定个体是否具有特定基因。参见,例如,WO2003054229。使用本领域普通技术人员已知的自动化高通量标记检测平台,使该过程非常有效率和有效。
如本文所述,在表1和2中列出的许多引物可以容易地用作FLP标记,来选择Rcg1基因座。这些引物也可以用于将相同区域中的这些标记转化成SNP或其它结构类似的或功能等同的标记(SSRs、CAPs、插入/缺失等)。SNP转变的一种非常多产的方法记载在Rafalski(2002a) Current opinion in Plant biology 5(2):94-100和Rafalski(2002b)PlantScience 162:329-333。使用PCR,引物用于扩增来自代表目标群体的多样性的个体(优选近交)的DNA区段。直接在一个或两个方向对PCR产物测序。比对得到的序列,并鉴别多态性。多态性不限于单核苷酸多态性(SNP),也包括插入/缺失、CAPS、SSR和VNTRs(同 向重复序列可变数)。具体地,关于本文所述的精细图信息,人们可以容易地使用本文提供的信息来得到使用本公开内容列出的引物扩增的区域内的其它多态SNP(和其它标记)。在所述图区域内的标记可以与BAC或其它基因组文库杂交,或与基因组序列电子地比对,以发现在与所述标记相同的近似位置处的新序列。
除了上述的SSR’s、FLPs和SNPs以外,其它类型的分子标记也被广泛使用,包括但不限于已表达序列标志(ESTs)和源自EST序列的SSR标记,和随机扩增多态DNA(RAPD)。本文使用的术语“遗传标记”应指任意类型的基于核酸的标记,包括但不限于,限制性片段长度多态性(RFLP)、简单序列重复(SSR)、随机扩增多态DNA(RAPD)、切割的扩增的多态序列(CAPS)(Rafalski和Tingey,1993,Trends inGenetics 9:275-280)、扩增片段长度多态性(AFLP)(Vos等,1995,Nucleic Acid Res.23:4407-4414)、单核苷酸多态性(SNP)(Brookes,1999,Gene 234:177-186)、序列表征的扩增的区域(SCAR)(Paran和Michelmore,1993,Theor.Appl.Genet.85:985-993)、标志序列位点(STS)(Onozaki等,2004,Euphytica 138:255-262)、单链构象多态性(SSCP)(Orita等,1989,Proc Natl Acad Sci USA 86:2766-2770)、简单序列重复区间(ISSR)(Blair等,1999,Theor.Appl.Genet.98:780-792)、反转录转座子间扩增多态性(IRAP)、反转录转座子-微卫星扩增多态性(REMAP)(Kalendar等,1999,Theor.Appl.Genet.98:704-711)、RNA切割产物(例如Lynx标记)等。
更一般地,当鉴别连锁的基因座时,术语“分子标记”可以用于指上面定义的遗传标记,或用作参照点的其编码产物(例如,蛋白)。标记可以源自基因组核苷酸序列或表达的核苷酸序列(例如,来自剪接的RNA、cDNA等),或来自编码的多肽。该术语也指与标记序列互补或侧接标记序列的核酸序列,例如用作探针或能扩增标记序列的引物对的核酸。“分子标记探针”是可以用于鉴别标记基因座的存在的核酸序列或分子,例如,与标记基因座序列互补的核酸探针。或者,在有些方面,标记探针指任意类型的能区分在标记基因座中存在的特定等位基因(即,基因型分析)的探针。当它们在溶液中特异性地杂交时,例如,根据Watson-Crick碱基配对规则,核酸是“互补的”。当位于插入/缺失区域(例如本文所述的非同线性区域)上时,本文所述的有些标 记也称作杂交标记。这是因为,作为定义,关于没有该插入的植物,插入区域是多态现象。因而,标记只需要指明是否存在插入/缺失区域。可以使用任意合适的标记检测技术来鉴别这样的杂交标记,例如SNP技术被用于本文提供的实施例中。
“基因组核酸”是其序列与细胞中的可遗传核酸相对应的核酸。常见实例包括核基因组DNA和其扩增子。在有些情况下,基因组核酸不同于剪接的RNA或对应的cDNA,因为剪接的RNA或cDNA通过例如剪接机制来加工,以去除内含子。基因组核酸任选地包含不转录的(例如,染色体结构序列、启动子区、增强子区等)和/或非翻译的序列(例如,内含子),而剪接的RNA/cDNA通常不具有不转录的序列或内含子。“模板核酸”是在扩增反应(例如,基于聚合酶的扩增反应例如PCR,连接酶介导的扩增反应例如LCR、转录反应等)中用作模板的核酸。模板核酸可以是基因组起源的,或者,可以源自表达的序列,例如,cDNA或EST。
在核酸扩增的上下文中,术语“扩增”是生成选定核酸(或其转录形式)的其它拷贝的任意方法。一般的扩增方法包括各种基于聚合酶的复制方法,包括聚合酶链反应(PCR)、连接酶介导的方法例如连接酶链反应(LCR)和基于RNA聚合酶的扩增(例如,通过转录)方法。“扩增子”是扩增的核酸,例如,通过任意可得到的扩增方法(例如,PCR、LCR、转录等),通过扩增模板核酸,生成的核酸。
在有些情况下,同工酶特性和关联的形态学特征也直接用作标记。尽管它们它们不直接检测DNA差异,但它们经常受到特定遗传差异的影响。但是,检测DNA变异的标记比同工酶或形态学标记更多且更多态(Tanksley(1983)Plant Molecular Biology Reporter1:3-8)。
序列比对或毗连群也可以用于发现在本文列出的特定标记上游或下游的序列。邻近本文所述标记的这些新序列然后可以用于发现和开发功能等同的标记。
例如,比对不同的物理和/或遗传学图,以定位在本说明书中没有描述、但是在类似区域中的等价标记。这些图可以是在玉米物种内,或甚至在已经遗传地或物理地与玉米比对的其它物种之间,例如稻、小麦、大麦或高粱。
如实施例2所指出的,通过使用来自侧接Rcg1基因座的区域的 共同序列(其与Mo17和B73 BAC文库中的BAC杂交),以盖瓦方式将来自两个文库的BAC与来自侧接Rcg1基因座的DE811ASR(BC5)同源区的BAC排列,如图9(a)所示。公开的B73 BAC,c0113f01和c0117e18被鉴别为分别在Rcg1基因座的正北和正南。
利用该信息,通过比对该区域内的遗传标记和B73 BAC的物理图,可以生成遗传标记UMC2285和UMC15a之间、UMC2285和UMC2187之间、UMC1086和UMC2200之间、或UMC2041和UMC2200之间的延长的非邻接的盖瓦方式的B73 BAC。从环球网上,通过前缀为“www.”的网址genome.arizona.edu/fpc/maize/#webagcol进入,可以从亚利桑那州基因组研究所的玉米基因组数据库获取B73的遗传学图和物理图的比对信息。在WebChrom的角度,人们可以选择在Rcg1基因附近的遗传标记,并获取与这些遗传标记所处的物理毗连群的连锁。通过以这样的方式比对物理图和遗传学图,人们可以发现遗传标记UMC2285和UMC15a、UMC2285和UMC2187、UMC1086和UMC2200或UMC2041和UMC2200定义的染色体区间之间的区域中过剩的B73 BAC。本领域技术人员可以使用BAC来开发用于将Rcg1基因座渐渗进玉米种质中的新标记。具体地,这样的遗传标记可以用于追踪其中已经渐渗进Rcg1基因座或Rcg1基因的任意系中的Rcg1基因座,并用于在回交程序中选择回归亲本基因组。
例如,为了设计可以用于在其它玉米种质中渐渗和选择Rcg1基因或基因座的多态标记,可以使用在Rcg1基因座周围区域的序列信息。存在许多在目标区域可获得的B73衍生的细菌人工染色体(BAC),从它们可以得到序列信息。在图21中显示了目标区域中的BACs的实例,该图显示了B73物理图上与DE811ASR(BC5)中的Rcg1区域同源的毗连群[图21 2006-03-10检察]。从因特网检察:<URL:http://www.genome.arizona.edu/cgi-bin//WebAGCoL/WebFPC/WebFPC_Direct_v2.1.cgi?name=maize&contig=187 & marker=ssu1>。序列信息通过已经可以公开得到的信息(例如BAC末端-序列、与该区域中的BACs杂交的已表达序列标志(ESTs)的序列、经常与这些ESTs相关的重叠寡核苷酸探针等)来获取,或通过在该区域直接测序BAC克隆得到新序列来获取。使用本领域技术人员已知的几种不同方法,从该序列中人 们可以确定哪个区域是最独特的。例如,通过使用基因预测软件或通过针对所有可得到的玉米序列blasting该序列,人们可以选择非重复的序列。低拷贝序列可以用于开发许多基于核酸的标记。这些标记用于筛选其中存在Rcg1基因座的植物材料和其中不存在Rcg1基因座的植物材料。如果需要在Rcg1基因座之外的标记,则使用该标记来筛选其中存在Rcg1基因座的植物材料和其中不存在Rcg1基因座的植物材料,以确定该标记在这样的种质中是否是多态的。多态标记然后在其它玉米种质中用于标记辅助的Rcg1区域的渐渗和选择,且最佳地也用于回归亲本基因组选择。因而,利用鉴别出的Rcg1基因座的定位和确立的它与对毛盘孢属抗性的关联,本领域技术人员可以利用任意数目的现有标记,或容易地开发新标记,它们可以用于渐渗或鉴别种质中Rcg1基因座的存在与否,和在回交程序中选择回归亲本基因组。
在遗传学图上,将一个分子标记与基因或另一个分子标记的连锁测量为重组频率。一般而言,遗传学图上的2个基因座(例如,2个SSR标记)越近,它们在物理图上彼此的位置越近。相对的遗传距离(通过交换频率确定,以厘摩为单位测量;cM)可以与染色体上2个相连锁的基因座彼此隔开的物理距离(以碱基对为单位测量,例如,千碱基对[kb]或兆碱基对[Mbp])成比例。cM和物理距离之间的精确比例的缺少,可以源自不同染色体区域重组频率的变异,例如,有些染色体区域是重组“热点”,而其它区域不表现出任何重组,或仅仅表现出罕见的重组事件。有些渐渗数据和作图信息提示,Rcg1基因座周围的区域是确实具有大量重组的区域。
一般而言,一个标记与另一个标记越近,无论按照重组还是物理距离测量,它们的连锁也越强。分子标记与赋予特定表型(疾病抗性)的多肽的编码基因越近,无论按照重组还是物理距离测量,该标记就越好地用于标记所需表型性状。如果可行,最好的标记是在基因本身中的标记,因为它总是保持与造成所需表型的基因的连锁。
也可以在相同农作物物种(包括玉米)的不同群体之间,观察到遗传作图变异性。尽管遗传学图中的该变异性可能发生在群体之间,但源自一个群体的遗传学图和标记信息通常仍可以用于跨多个群体的具有所需性状的植物的鉴别中、具有不希望的性状的植物的反选择 中和指导MAS。
为了定位跨遗传学图的等价标记,可以使用作图群体来证实任意这样的等价标记是否在本文所述区域内,并从而用于选择Rcg1。使用该方法,在这样的作图群体上绘制等价标记、以及本文列出的标记。落入相同区域内的任意等价标记可以用于选择Rcg1。本领域已知的且可以用于该目的的作图群体包括、但不限于,在Sharopova,N.等(2002)Plant MolBiol 48(5):463-481和Lee,M.等(1999):Tools forhigh resolution genetic mappingin maize-status report.Proc.PlantAnimal Genome VII,January 17-21,1999,SanDiego,USA,P.146中描述的IBM群体和T218 X GT119 IF2群体;在Davis,G.L.等(1999)Genetics 152(3):1137-72和Davis,M.D.等,(1998)The 1998 UMCMaize Genetic Map:ESTs,Sequenced Core Markers,and NonmaizeProbes as a Foundation for GeneDiscovery,Maize Genetics ConferenceAbstracts 40中描述的UMC 98群体。
本文使用的“渐渗现象”或“渐渗”指,通过下述方式,使基因或基因座从一个系移动到另一个系:(1)使每个系的个体杂交,以生成群体;和(2)选择携带所需基因或基因座的个体。每次杂交后,重复选择过程。例如,实施方案的基因、或含有该基因的基因座,可以渐渗进非抗性的或仅仅部分抗性(这意味着它对Cg敏感或易感,或对Cg部分地敏感或易感)的回归亲本中。含有渐渗的基因或基因座的回归亲本系然后具有增强的或新赋予的对Cg的抗性。其中已经渐渗进Rcg1基因座的系在本文中称作Rcg1基因座转变。
当该过程重复2次或更多次时,渐渗的过程经常称作“回交”。在渐渗或回交中,“供体”亲本指含有待渐渗的所需基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“回归”亲本(使用2次或更多次)指向其中渐渗基因或基因座的亲本植物。例如,参见Ragot,M.等(1995)Marker-assisted backcrossing:a practical example,in TechniquesetUtilisations des Marqueurs Moleculaires(Les Colloques,Vol.72,pp.45-56和Openshaw等,(1994)Marker-assisted Selection in BackcrossBreeding,Analysis ofMolecular Marker Data,pp.41-43。初步杂交产生F1代;术语“BC1”则指回归亲本的第二次使用,“BC2”指回归亲本的第三次使用,依此类推。
在Rcg1的情况下,其中可以得到该基因和非常接近区域的序列,可以开发基于该基因本身或紧密连锁序列的DNA标记,以用于在回归亲本背景下直接选择供体基因。尽管可以使用来自携带该基因的染色体区域的任意多态DNA序列,但在实施方案中提供的序列允许使用在该基因内或附近的DNA标记,从而使基因的假阳性选择最小化。侧接标记限制导入受体背景中的供体基因组片段的大小,从而使所谓的“连锁拖曳”最小化,这意味着从供体系导入不需要的序列,所述序列影响另外原种种质的植物性能。实施方案提供了可以如此使用的DNA标记的多个实例,且本领域技术人员能使用提供的基因组序列来生成甚至更多的标记。一个实例是使用特异性地(排它地)与和基因座紧密连锁(包括在基因座内)的序列杂交(在RFLP测定的情况下)或退火(在PCR测定的情况下)的标记。原则上,如果组合使用几个这样的标记,则可以使用还在基因组的其它地方杂交或退火的序列。当使用PCR反应时,实践中在扩增反应中使用的引物的长度应当是至少约15个核苷酸,但是根据序列和杂交条件,可以使用提供特异性退火的任意长度,例如约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28或更长。对于PCR反应,术语“退火”常规地使用,且如本文使用的,它应当理解为具有与“杂交”相同的含义。
因而,通过使用本文所述的标记和方法,人们可以生产包含截短的染色体区间的植物,所述截短的染色体区间包含Rcg1基因座和/或Rcg1基因。术语“染色体区间”或“染色体区段”指在植物中(in planta)存在于单个染色体上的基因组DNA的邻接线性区间,通常参照定义染色体区间的末端的2个标记来定义。指定的区间可以包括在末端的标记(例如一个或多个标记在标记A和标记B定义的染色体区间上或内部),或可以不包括在区间末端的标记(例如一个或多个标记在标记A和标记B定义的染色体区间内部)。截短的染色体区间指,通过选择一个或多个已经减小染色体区间大小的重组事件,而已经被减小尺寸的染色体区间。“重组事件”指同源染色体之间发生的重组,且也指其中已经发生重组的特定的染色体定位(例如在染色体末端内侧的染色体区间的重组,将在染色体区间的每个末端具有重组事件)。参照在区段末端点的一个或2个新标记,可以定义截短的染色体区间。通过 厘摩或碱基对,可以测量2个染色体区段的长度。位于单个染色体区间上的遗传元件或基因是物理地连锁的。染色体区间的大小没有特殊限制,但是在本发明实施方案的上下文中,位于单个染色体区间内的遗传元件通常也是遗传上连锁的。
使用实施方案的方法,可能选择包含截短的染色体区间的植物,所述截短的染色体区间包含Rcg1基因。具体地,参照下面实施例中更详细描述的本发明,染色体区间可以减小至12cM或更小、10cM或更小、8cM或更小、6cM或更小、4cM或更小、3cM或更小、2.5cM或更小、2cM或更小、1.5cM或更小、1cM或更小、0.75cM或更小、0.50cM或更小或0.25cM或更小的长度,在每种情况下,参照从2006年3月21日生效的IBM2相邻4遗传学图所示的图距进行测量。如按照碱基对测得的,染色体区间可以减小至15mbp或更小、10mbp或更小、5mbp或更小、3mbp或更小、1mpb或更小、500kbp或更小或250kbp或更小的长度。本领域技术人员会明白,不希望造成非常近侧Rcg1编码序列的染色体区域的断裂(例如在5kpb内或更小、在4kbp内或更小、3kbp或更小、2kbp或更小、1kbp或更小或0.5kbp或更小),从而使得启动子和其它上游调节元件与编码序列不连锁。
术语“基因座”通常指,携带基因(或可行时,2个或更多个在遗传上非常紧密连锁的基因,它们作为负责表型的单个基因座起作用)的染色体的遗传上确定的区域。当在本文中提及Rcg1使用时,“Rcg1基因座”应指染色体的确定区域,它携带Rcg1基因,包括它的相关调节序列,以及与B73非同线性的Rcg1基因周围的区域,或其保留Rcg1基因和相关调节序列的任意更小的部分。该基因座还在别处称作ASR基因座,且在这里将称作Rcg1基因座。
“基因”指基因座内的特定遗传编码区,包括它的相关调节序列。编码Rcg1初级转录物的区域在本文中称作“Rcg1编码序列”,将用于定义Rcg1基因的位置,且本领域技术人员会理解,相关的调节序列将在离Rcg1编码序列约4kb的距离内,启动子位于它上游。本发明的一个实施方案是,分离Rcg1基因,并证实它是负责由基因座的存在而赋予的表型的基因。
本文使用的“连锁的”或“连锁”(与术语“可操作地连接”相区分) 指基因座或基因的遗传的或物理的连锁。如果在单个减数分裂图上测得,它们之间的重组频率小于约50%,则认为基因座或基因是遗传连锁的。如果在单个减数分裂图上测得,重组频率是约40%、约30%、约20%、约10%或更小,则它们是逐渐更大连锁的。如果已经证实它们是在单个DNA片段(例如染色体)上,则2个或更多个基因是物理连锁的(或同染色体上的)。遗传连锁的基因在实践中是物理连锁的(或同染色体上的),但是尚未证实确切的物理距离(核苷酸数目)。本文使用的术语“紧密连锁的”指遗传连锁的标记在15cM或更小内,包括但不限于12cM或更小、10cM或更小、8cM或更小、7cM或更小、6cM或更小、5cM或更小、4cM或更小、3cM或更小、2cM或更小、1cM或更小和.5cM或更小,如在本公开内容前面提及的MaizeGDB网站上可公开得到的IBM2相邻4遗传学图上所测得的。DNA序列,例如代表在基因座内的序列或与其互补的序列的短寡核苷酸,也与该基因座连锁。
“系”或“品系”是一组相同家系的个体,它们通常是一定程度的近交,且通常在大多数基因座处是纯合的和同质的。
“祖系”或“祖先”是用作基因来源的亲本系,例如,用于开发原种系。“后代”是祖系的后裔,且可以通过许多代育种与它们的祖先分离。例如,许多原种系是B73或Mo17的后代。“系谱结构”定义了后裔和产生该后裔的每个祖先之间的关系。系谱结构可以跨一代或多代,描述后裔和它的亲本、祖亲本、曾祖亲本等之间的关系。
“原种系”或“原种品种”是已经从为优秀的农艺学性能而进行的许多育种和选择循环中产生的农艺学上优秀的系或品种。“原种近交系”是作为近交的原种系,且已经表明可以用于生产足够高产的、且农艺学上适宜的杂种品种(“原种杂种品种”)。可以得到许多原种系和品种,且是玉米育种领域技术人员已知的。类似地,“原种种质”是农艺学上优秀的种质,其通常源自和/或能产生具有优秀的农艺学性能的植物,例如现有的或新开发的玉米原种系。
相反地,“外来玉米系”或“外来玉米种质”是源自不属于可得到的原种系、原种品种或原种种质的玉米的种质。在2个玉米植物之间杂交的上下文中,外来系或外来种质在血统上不与它杂交的原种系、原种品种或原种种质紧密相关。最常见地,选择外来系或外来种质来将 新遗传元件(通常新等位基因)导入育种程序。
单位、前缀和符号可以以它们的SI接受的形式注解。除非另有说明,核酸以5′至3′方向从左向右书写;氨基酸序列以氨基至羧基方向从左向右书写。数字范围包含定义该范围的数字。氨基酸在本文中可以用它们普遍已知的三字母符号或IUPAC-IUB生化命名委员会(Biochemical Nomenclature Commission)推荐的单字母符号来表示。类似地,核苷酸可以用它们普通接受的单字母代码来表示。上面定义的术语参照说明书整体更完全地定义。
关于本文指出的图方向,代替术语5’和3’,使用术语“北边”和“上边”(例如,在Rcg1基因北边的标记指,参照以垂直方向提供的图,例如图7和8,确定的在Rcg1基因上边的标记,和参照以水平方向提供的图,例如图22,确定的在Rcg1基因左边的标记)。类似地,使用术语“南边”和“下边”(例如,在Rcg1基因南边的标记指,参照本文提供的垂直方向的图确定的在Rcg1基因下边的标记,和参照本文提供的水平方向的图确定的在Rcg1基因右边的标记)。更具体地,在Rcg1编码序列上边指,在SEQ ID NO:1的初级转录物上边或北边的染色体(大致在FLP110F),且在Rcg1编码序列下边指,在SEQ IDNO:1的初级转录物下边或南边的染色体(大致在FLPA1R)。参见图26。术语“近侧”和“远侧”是相对术语,当用于相对于指定位置对比图上的2个点时,分别指离指定位置(例如,Rcg1基因)更近和更远。
术语“计算机系统”泛指用于执行有些或全部本文所述方法步骤的各种自动化的系统。术语“指令”指,指示计算机系统执行有些或全部方法步骤的计算机代码。除了实施有些或全部方法步骤外,数字或模拟系统(例如,包含数字或模拟计算机)也可以控制许多其它功能,例如用户可视显示器(例如,以允许用户观察方法结果)和/或输出控制部件(例如,以辅助标记辅助选择或控制自动化野外装备)。
本文所述的某些方法可以任选地(且一般地)通过一种或多种计算机程序(例如,储存并可以用于分析分子标记数据)来实现。因而,实施方案提供了数字系统,例如,计算机、计算机可读介质和/或包含用于执行本文方法的指令(例如,包含在适当软件中)的集成系统。数字系统将包括与对于一组遗传标记的植物基因型和任选的表型值和/或家族关系相对应的信息(数据)。系统也可以辅助用户根据本文方法 进行Rcg1的标记辅助选择,或可以控制野外装备,该装备可以自动化选择、收获和/或育种方案。
通过输入装载在数字系统存储器中的数据,并对数据进行本文指出的操作,可以使标准的桌面应用程序例如字处理软件(例如,Microsoft WordTM或Corel WordPerfectTM)和/或数据库软件(例如,电子制表软件例如Microsoft ExcelTM、Corel Quattro ProTM或数据库程序例如Microsoft AccessTM或ParadoxTM)适用于实施方案。例如,系统可以包含与用户界面联合使用的具有适当的基因型数据和任选的系谱数据的前述软件(例如,在标准操作系统例如Windows、Macintosh或LINUX系统中的GUI),以进行本文指出的任意分析,或简单地获取要在本文方法中使用的数据(例如,在电子制表软件中)。计算机可以是,例如,PC(Intel x86或奔腾芯片兼容的DOS,TM OS2,TM WINDOWS,TM WINDOWS NT,TM WINDOWS95,TMWINDOWS98,TM LINUX,Apple-兼容的,MACINTOSHTM兼容的,Power PC兼容的,或UNIX兼容的(例如,SUNTM工作站)机器)或技术人员已知的其它商业上常见的计算机。根据本文方法,技术人员使用标准的编程语言,例如Visualbasic、Fortran、Basic、Java等,可以构建用于进行关联分析和/或表型值预测的软件。
任意系统控制器或计算机任选地包含监视器,后者可以包括,例如,阴极射线管(“CRT”)显示器、平板显示器(例如,有源矩阵液晶显示器、液晶显示器)等。计算机线路通常置于盒子中,该盒子包含许多集成电路芯片,例如微处理器、存储器、接口电路等。该盒子也任选地包含硬盘驱动器,软盘驱动器,高容量可移动驱动器,例如可写入CD-ROM和其它常见外围设备。相关计算机系统中的输入装置(例如键盘或鼠标)任选地提供用户输入和用户选择遗传标记基因型、表型值等。
计算机通常包含用于接收用户指令的适当软件,无论是以用户输入一组参数字段的形式(例如,在GUI中),还是以预编程的指令形式(例如,为许多不同的特殊操作预编程)。软件然后将这些指令转换成适当语言,以指导系统进行任意需要的操作。例如,数字系统可以根据本文的相关方法,指导选择包含某些标记的植物,或控制野外装备收割、选择、杂交或储藏农作物。
本发明也可以在应用特异性的集成电路(ASIC)或可编程逻辑装置(PLD)的线路内实现。在这样的情况下,本发明可以用用于生成ASIC或PLD的计算机可读的描述符语言实现。本发明也可以在许多其它数字设备(例如PDAs、膝上型计算机系统、显示器、图像编辑装置等)的线路或逻辑处理器内实现。
实施例
在下面的实施例中进一步定义了本发明实施方案,除非另有说明,其中所有份数和百分比都是按重量计,且度数是摄氏度。应当理解,在指示本发明实施方案时,这些实施例仅仅作为解释而提供。从上面的讨论和这些实施例中,本领域技术人员可以确定本发明实施方案的基本特征,且可以在不脱离其精神和范围的情况下,作出各种变化和修改,以使它适应各种用途和条件。因而,除了本文表明和描述的那些以外,本领域技术人员从前面描述可以明白本发明实施方案的各种修改。这样的修改也在所附权利要求书的范围内。本文所述每篇文献的公开内容,整体引作参考。实施例1-4和7-12是实际的。实施例5、6和13是部分实际、部分预测的。
实施例1
4L特定区域的Rcg1基因座的精细作图
为了绘制和克隆负责玉米系MP305对Cg的抗性的基因,以前已经生成了系,它们彼此在遗传上的差异尽可能地少,例外是,存在负责抗性表型的基因座。这样的系称作近等基因系。为此目的,已经将DE811与MP305杂交,且已经将后代与敏感系DE811回交3次,在每次回交时,选择对Cg的抗性和另外DE811特征(Weldekidan和Hawk,(1993),Maydica,38:189-192)。得到的系命名为DE811ASR(BC3)(Weldekidan和Hawk,(1993)同上)。该系用作Rcg1基因座的精细作图的起点。首先必须大致知道它在玉米基因组中位于何处。使用标准的遗传方法,Jung等((1994)同上)以前已经定位了染色体4长臂上的基因座。
因为以前已经将Rcg1基因座作图在玉米染色体4的长臂上,所以使用上面Jung等(1994)得到的基因座附近的标记上的信息,分析 位于命名为4.06-4.08的染色体区域中的所有可得到的公开可得的和私有的简单序列重复(SSR)标记,以确定这些标记是否在2个近等基因系DE811和DE811ASR(BC5)之间是多态的。如下从上面Weldekidan和Hawk(1993)所述的DE811ASR(BC3)系衍生出DE811ASR(BC5)系:通过在选择对Cg的抗性下与DE811的2次回交,然后自交5代和选择,以得到BC5系。使BC5系与DE811另外回交2次,以生成用于精细作图的BC7分离群体。为了能够在家族基础上进行表型评价,使BC7个体自交,以生成BC7S1家族。
从该分析,发现2个SSR标记PHI093和UMC2041是多态的。使用可公开得到的相互交配(inter-mated)(Coe等(2002)PlantPhysiol.128:9-12;Gardiner,等,(2004),PlantPhysiol.,134:1317-1326;Yim等,(2002)Plant Physiol.130:1686-1696)B73 X Mo17(IBM)neighbors map(Lee等(2002)Plant Mo1 Biol 48:453-61;Sharopova等,(2002)Plant Mol Biol 48:463-81),使用3个附近的限制性片段长度多态性(RFLP)标记CDO3 65、CSU 166和CDO 127的序列,来生成片段长度多态标记(下文命名为FLPs)。FLPs是在使用确定序列的引物的PCR反应之后,使用凝胶电泳或任意类似的高分辨率片段分离方法可以测定的标记。发现所有3个标记都是多态的。在表1中总结了绘制Rcg1基因座图所使用的FLPs。在表1中所示的MZA FLPs的任意引物(它们也具有表2所示的相同MZA标记名称),将扩增在表2所示内部序列内部的FLP的区域。表1列出的所有引物的退火温度是60℃。
为了确定这3个多态FLPs和2个多态SSR的存在是否与抗性表型相关联,从而指示携带Rcg1基因座的区域位于含有这3个标记的染色体区段上,生成一个表,其中通过野外观察确定4784个体的表型状态,并输入通过片段大小分析测得的相对于5个标记中的每一个的基因型状态。该数据依次呈递给软件程序Joinmap(Van Ooijen,等,(2001),PlantResearch International,Wageningen,the Netherlands)和Windows QTL Cartographer(Wang,等,(2004),(在线,2.0版在2004-06-14检索,2.5版在2005-02-22检索);在因特网上从北卡罗来纳州立大学统计遗传学和生物信息学(North Carolina StateUniversityStatistical Genetics and Bioinformatics)网站检索<URL:http: //statgen.ncsu.edu/qtlcart/WQTLCart.htm>。前一个程序测定沿着染色体区域的标记次序。后者测定标记的特定等位基因(标记的2个多态形式中的一个特定形式)是否与表型的存在显著相关。一个或另一个等位基因的存在与抗性表型更显著相关的标记,可能更接近负责抗性表型的基因。图3描述了Windows QTL Cartographer生成的图,它显示了负责Cg抗性表型的基因座位于FLP标记定义的染色体上的特定位置(X轴)处的机会(Y轴)的统计学分析。
从Fengler等((2004)Plant and Animal Genome XII Abstract Book,Page 192(Poster number P487),January 10-14,San Diego,California)和上面的Gardiner(2004)所述的综合物理和遗传学图,可能鉴别2个细菌人工染色体(BAC)毗连群,它们源自Mo17 BAC文库,携带上述遗传标记。
但是,含有侧接目标区域的标记的2个BAC毗连群,含有不知大小的缺口。为了鉴别在该缺口架桥的其它BAC,使用含有标记(其具有物理图上的已知位置)的密集遗传学图(Fengler,(2004)同上)来发现通常与以前在2个BAC毗连群上鉴别出的标记遗传连锁的其它标记。表2中的这些其它标记,用于从B73 BAC文库鉴别BAC毗连群,它们关闭了以前发现的Mo17-衍生的BAC毗连群之间的物理缺口(Coe等(2002)同上;Gardiner(2004)同上;Yim等(2002)同上。4个标记MZA11455、MZA6064、MZA2591和MZA15842用于作图目的。在表2中,“E”代表“外部的”,且“I”代表“内部的”,它们分别指在嵌套式PCR过程中使用的外部和内部引物。外部集合用于第一轮PCR,此后内部序列用于在第一轮产物上的第二轮PCR。这增加反应的特异性。大写字母代表基于载体序列的引物部分,它们以后用于测序PCR。它们不是玉米序列。关于正向内部嵌套MZA引物,序列的大写部分是SEQ ID NO:126,且关于反向内部嵌套MZA引物,大写部分是SEQ ID NO:127。表2所示的内部正向MZA嵌套引物的序列因此是SEQID NO:126和每个各自引物的SEQ ID NO的组合。类似地,表2所示的内部反向MZA嵌套引物的序列是SEQ ID NO:127和每个各自引物的SEQ ID NO的组合。这些组合在表2中的SEQIDNO:列表示。表2列出的所有引物的退火温度是55℃。表2所述的所有标记已经在不同组的玉米种质内表现出多态性,包括MP305和 表18所示的玉米系。
使用几种这样的BAC的末端序列以及已知位于这些BAC上的EST,来鉴别用于进一步缩小基因座定位范围的新标记。用于该目的的其它标记在表1中命名为FLP8、FLP27、FLP33、FLP41、FLP56和FLP95。以与上述类似的方式,确定表型和基因型关联。测得基因座最可能位于FLP8和FLP27之间(参见图3)。
实施例2
从抗性系分离BAC克隆和在Rcg1基因座区域鉴别候选基因
为了分离负责Rcg1基因座赋予的表型的基因,从由抗性系DE811ASR(BC5)制备的BAC文库分离出含有FLP 8和FLP 27标记之间的区域的BAC。使用制备基因组DNA的标准技术(Zhang等(1995)Plant Journal 7:175-184)制备该文库,然后用HindIII部分消化,并将大小选择的片段连接进改良形式的可商业得到的载体pCC1BACTM(Epicentre,Madison,USA)。按照出售商的说明书(Epicentre,Madison,USA)转化进EPI300TM大肠杆菌(E.coli)细胞后,将125,184个重组克隆排列在326 384-孔微量滴定盘中。然后将这些克隆装格子到尼龙滤器上(Hybond N+,Amersham Biosciences,Piscataway,USA)。
用在前面实施例表明存在于FLP8和FLP27之间的BAC序列中的序列的基础上设计的重叠寡核苷酸探针(重叠寡核苷酸探针;Ross等(1999)Screening large-insertlibraries by hybridization,p.5.6.1-5.6.52,In A.Boyl,ed.Current Protocols inHuman Genetics.Wiley,New York)探测文库。进行BLAST搜索分析,以筛选出重复序列,并鉴别出用于探针设计的独特序列。通过PCR,证实探针在毗连群上的位置和间距。对于每个探针,设计8 bp自互补的2个24-聚体寡核苷酸。它们的退火产生40 bp重叠寡核苷酸,补平它们的2个16 bp突出端。在表4中显示了以此方式使用的探针。应当指出,有些这样的探针是基于也在实施例1和表1中使用的标记的,但是确切序列是不同的,因为它们被用作重叠寡核苷酸探针,而不仅仅是PCR引物。如(Ross等(1999)同上)所述制备杂交探针,并如(Ross等(1999)同上)所述杂交和洗涤通过装格子BAC文库制备的滤器。使用感光成像仪分析来检测杂交信号。此后,如下剥离膜的探针:将它们置于刚刚沸腾的0.1XSSC和0.1%SDS的溶液中,且使它们在溶液中过夜冷却至室温。
从平板分离产生阳性信号的BAC。使用限制酶切作图、含有与以前使用的标记相对应的引物和从每个BAC末端得到的序列的PCR实验来测定覆盖目标区域的BAC的次序。选择跨整个区域的4个BAC用于测序。使用标准的鸟枪法测序技术和使用Phred/Phrap/Consed软件包(Ewing等(1998)Genome Research,8:175-185)装配的序列,对 这些BAC测序。
装配后,注解在作图数据的基础上认为最接近基因座的区域中的序列,即推导出可能的基因编码区和代表重复元件的区域。使用fGenesH软件包(Softberry,Mount Kisco,New York,USA),搜索基因编码(基因的)区域。fGenesH预测出蛋白的部分,当BLAST(BLASTx/nr)时,它在氨基酸水平显示出与稻蛋白的部分(该部分注解为编码赋予稻疾病抗性的蛋白)的部分同源性。表现出与该蛋白的同源性的玉米序列部分落在BAC共有序列的邻接序列段末端,且似乎被截短。为了充分代表玉米BAC中的基因,在针对来自相同玉米BAC克隆的所有其它共有序列的tBLASTn分析中,使用稻氨基酸序列。这导致代表玉米基因3′末端的共有序列的鉴别。但是,在这样得到的序列中没有代表该基因的中心部分。基于推定基因的5′和3′区域,设计PCR引物,并用于PCR实验,该PCR实验使用来自原始玉米BAC的DNA作为模板。产生的PCR产物的序列含有连接以前分离的5′和3′片段的序列。
DE811ASR(BC5)已经保藏在ATCC,且本文所述的方法可以用于获得包含Rcg1基因座的BAC克隆。如图9(a)所示,含有Rcg1基因座的DE811ASR(BC5)染色体区间与B73和Mo17的对应区域非同线(参见图9和22),如通过分析BAC文库确定的。
使用与Mo17和B73 BAC文库中的BAC杂交的共同序列,以盖瓦方式排列来自2个文库的对应BAC,如图22所示。为了附图的目的,给出图22中B73 BAC的更短名称。下面的表3显示了在图22上指出的每个BAC命名的BAC ID。公开的B73 BAC,c0113f01和c0117e18分别在Rcg1基因座插入/缺失区域的正北和正南,在B73中发生缺失。可以在几个网站上看到关于这2个BAC的信息,包括玉米GDB网站(maizegdb.org)、Gramene网站(gramene.org)和亚利桑那州基因组研究所的玉米基因组数据库(genome.arizona.edu)。亚利桑那州基因组研究所网站还提供了玉米琼脂糖FPC Map,2005年7月19日版,它鉴别出了邻接c0113f01和c0117e18的BAC。通过搜索这些数据库,鉴别出许多BAC,它们形成侧接Rcg1基因座的区域的毗连群。因而,现在已经在玉米遗传学图和物理图上鉴别出Rcg1基因座和Rcg1基因的精确位置。参见图7(a、b)和22。
表3:在图22中的BAC命名,它们是上述亚利桑那州基因组研究所网站所示的B73的187毗连群(B73a至B73p)或188毗连群(B73q至B73af)的部分。
推定基因的完整序列由SEQ ID NO:1显示。该基因含有1个内含子,从SEQ ID NO:1的核苷酸950至核苷酸1452。使用从DE811ASR(BC5)植物制备的RNA进行反转录酶-PCR,以确定内含子 的边界。该基因的蛋白编码序列为SEQ ID NO:2所示,且氨基酸翻译为SEQ ID NO3所示。预测的蛋白具有110.76 kD的分子量。
大致从氨基酸157至404的氨基端与所谓的核苷酸结合位点(NBS)具有同源性。存在与大致位于氨基酸528-846的LRR结构域具有宽松同源性的区域。但是,与以前研究的NBS-LRR蛋白不同,该富亮氨酸的区域缺少在更经典的LRR结构域中可见的系统性重复性质(Lxx),且具体的,没有Wang等((1999),Plant J.19:55-64)或Bryan等((2000),Plant Cell12:2033-2045)所述的共有序列的实例。该基因与如图2(a、b和c)所示的稻基因和大麦基因家族具有宽松同源性。大多数同源性是在蛋白的氨基末端;羧基末端是非常不同的。这在图2(a、b和c)中用粗体表示,它们是与实施方案的基因相同的氨基酸,而不同的那些没有以粗体表示。
表4.退火来合成重叠寡核苷酸探针的寡核苷酸
实施例3
抗性和易感系之间的Rcg1基因座区域内的基因结构对比和在抗性和易感系之间 的该区域内发现的候选基因的表达特性
发现在遗传上确定的携带负责炭疽病表型抗性的基因座区域中的候选基因后,首先进行努力来确定该区域是否可能存在其它基因,其次确定候选基因的表达模式是否与它的推定作用相一致。Fu和Dooner((2002),Proc Natl Acad Sci 99:9573-9578)和Brunner等((2005),Plant Cell 17:343-360)已经证实,不同的玉米近交系可能具有显著的重排,且彼此缺少同线性。因而在更大的区域对比这样的基因组是复杂 的。Mo17(Missouri 17)和DE811ASR(BC5)的这样的基因组对比揭示,在DE811ASR(BC5)中发现候选基因的区域中,存在相对于Mo17的大插入。对插入内部和周围的区域测序,并扫描可能的基因。在DE811ASR(BC5)和Mo17基因组两者中发现了编码核酮糖二磷酸羧化酶(核酮糖二磷酸羧化酶-加氧酶,光合作用之后的碳固定涉及的蛋白,它的基因以多个拷贝存在于玉米基因组中)亚基的基因,它紧挨在Rcg1基因位置的下游。发现了与营养储藏蛋白有关的假基因(由于破坏编码序列的突变,导致非功能性的基因),它仅仅存在于DE811ASR(BC5)基因组中,在Rcg1基因上游一段距离。可能编码具有可能与疾病抗性相关的功能的蛋白的唯一的结构完整的基因是在前面实施例分离出的Rcg1基因。同等不可能参与疾病抗性的其它基因以及大量重复序列位于离基因座最可能的位置更远的距离。
为了确定Rcg1基因是否转录和在何处转录,使用两种技术。首先,使用大量平行特征测序(Massively Parallel Signature Sequencing)(MPSS;Lynx Therapeutics,Berkeley,USA),测量抗性和易感的植物材料的RNA特性。简而言之,如(Brenner,S.等(2000)Nat.Biotechnol.18(6):630-634)所述,构建cDNA文库,并固定化到微珠上。在固体支持物上构建文库,允许在单层中排列文库,并允许平行地对数千个克隆进行核苷酸序列分析。分析产生“特征”17-聚体序列,它的发生频率与植物组织中转录物的丰度成比例。对从DE811ASR(BC5)和DE811(对照系,易感Cg)制备的RNA衍生出的cDNA进行MPSS分析。得到的特征的生物信息学检查表明,在Cg接种后9天(DPI),在本文中称作Lynx19的特征序列(SEQID NO:19)以百万分之43(ppm)存在于来自DE811ASR(BC5)未受感染的茎的RNA样品中,且以65ppm存在于感染的、抗性茎中。在易感玉米系DE811的未受感染的或Cg-感染的茎的cDNA文库中,没有检测出该特征序列。Rcg1的序列分析表明,17-聚体标记存在于该基因的推定3′非翻译区中SEQ IDNO:1的核苷酸3945-3961处。
通过RT-PCR实验,得到了Rcg1在源自MP305且抗炭疽病茎腐烂的玉米系中排它表达的其它证据。使用RNA STAT-60TM(Iso-TexDiagnostics,Friendswood,Texas,USA),从抗性的(DE811ASR1(BC5))和易感的(DE811)玉米系的未受感染的和Cg-感染的茎分离出总RNA。使用Gene AmpRNA-PCR试剂盒(Applied Biosystems,FosterCity,California,USA),将来自0、3、6、9和13 DPI抗性和易感样品的总RNA(250ng)拷贝成cDNA,并扩增。根据试剂盒规程,使用随机六聚体作为引物,装配cDNA合成反应,并在42℃温育45分钟。对于PCR,分别使用从Rcg1的推定3′非翻译序列设计的KEB131(SEQID NO:20)和KEB138(SEQ IDNO:21)作为上游和下游引物。将cDNA扩增30个由在94℃1分钟、在50℃2分钟和在72℃3分钟组成的循环,然后在72℃延伸7分钟。如图4所示,RT-PCR的等分试样的琼脂糖凝胶电泳揭示,260bp带存在于源自受感染的和未受感染的抗性植物的样品中,但是在易感样品中不存在。DNA序列分析证实,该片段与Rcg1序列的nt 3625-3884相对应,与从引物KEB131和KEB138预测的扩增产物相一致。
实施例4
含有候选基因中的Mu插入的系的分离
确定基因是否负责表型的一种方法是,通过插入转座因子(所谓的转座子标记)遗传地破坏该基因,然后确定是否改变了植物的相关表型,在本例中,从对Cg的抗性变成对Cg易感。在玉米中,这可以使用增变基因(Mu)元件来完成(Walbot,V.(1992)Annu.Rev.PlantPhysiol.Plant Mol.Biol.43:49-82)。图5所示的基本策略是,将有活性的增变基因元件导入携带抗性基因的系中,通过测定相关的DNA标记以及接种Cg后对Cg的抗性,分离抗性基因纯合的植物,然后使这些纯合的植物与易感“试验者”系杂交。如果抗性基因是显性的,则原则上所有产生的后代都是对基因抗性但杂合的。但是,如果Mu元件以破坏其功能的方式插入抗性基因,则个体会对Cg易感。然后可以分离和表征被破坏的基因。
使MP305与15种不同的增变基因原种(携带有活性的增变基因元件的系)杂交。使得到的F1以所有可能的组合相互交配(彼此杂交)。为了追踪已知它上面存在抗性基因座的染色体区域4L(参见实施例1),选择已知位于来自实施例1所述工作的基因座附近的许多DNA标记,并用于Mu-标记的材料上。检查约1500个来自相互交配过程的后代植物对Cg的抗性和这些标记的存在。使用实施例1所述的DNA 印迹(Botstein等,(1980)Am.J.Hum.Gen.32:314-331)(对于RFLP标记)或PCR(对于FLP标记),分析标记。选择对所有测试的标记纯合的且对Cg抗性的植物,并与易感试验者系(A63、EH6WA和EF09B)测交。然后种植从这些纯合的且抗性的植物产生的约16,000粒测交种子,并用作母本(指去除了产生花粉的雄花穗),与用作父本的易感试验者系杂交。筛选所有雌性植株对Cg的易感性。鉴别出超过10株易感植物(推定的敲除突变体)。收获来自每株这样的易感植物的开放传粉的种子,用8株抗性姊妹株作为对照。
从来自每一推定的敲除和对照抗性姊妹株的一组24株幼苗(生长在纸巾中)中提取DNA。将该DNA用作模板,以使用基因-特异性的引物以及从来自增变基因元件序列的末端反向重复序列(TIR)设计的共有引物(SEQ ID NO:125),从Mu-插入位点扩增侧接序列。换而言之,如果Mu元件已经插入在实施例2中分离的候选基因,则只会观察到PCR产物。引物FLP110F、FLP110R、FLP111F、FLP111R、FLP112F、FLP112R、FLP113F和FLPA1R用作基因-特异性的引物(参见表1)。将PCR扩增的产物印迹到尼龙膜上,并与从实施例2分离的候选基因的DNA探针杂交。从凝胶切下表现出强杂交的PCR产物,纯化,克隆,并测序。通过与来自候选基因和Mu-TIR的序列比对,分析得到的序列。增变基因元件在插入位点造成9bp同向重复。基于侧接序列信息和9bp同向重复,在候选基因的外显子1中鉴别出了4个独立的插入(图5)。在基因的5′非翻译区,在起始密码子上游约97bp处检测出一个插入(m177)。在3株易感植物m164、m159和m179中,在起始密码子下游270bp检出了一个共同的插入事件。发现m171易感植物含有2个Mu-插入,在起始密码子下游556bp和286bp处。当使用该基因的外显子1区域作为DNA探针进行DNA印迹时,观察到的修改的杂交模式进一步证实了这些结果。
该实施例和前述实施例可以总结如下。在实施例1中引用的早期工作表明,以前观察到的赋予对Cg的抗性的基因座位于玉米染色体4的长臂上。完全不知道该基因座的性质、它的确切位置或它编码的基因。在实施例1中进行的工作证实,该基因座可以作图到染色体4长臂上的非常小的区域。实施例2证实,在该染色体区仅仅发现一个基因可能是这样的抗性基因。它编码新形式的NBS-LRR蛋白,即已知 参与对病原体抗性的蛋白家族,但是它们的序列和抗性特异性有很大变化。实施例3表明,该基因仅仅存在于抗性系中,不存在于等基因的易感系中,且在抗性系中发现了与该基因相对应的转录物,从而表明该基因被表达,且这些转录物仅仅见于抗性系中。实施例4证实,在4个独立分离的Mu插入事件中,当通过插入Mu元件来破坏基因时,这些植物的表型从对Cg抗性变成对Cg易感。总之,这些数据有力地证实,本发明实施方案的主题是可以增强或赋予玉米植物Cg抗性的基因。
实施例5
Rcg1基因座回交进易感系
进行近交的Rcg1基因座渐渗,以证实Rcg1基因座可以成功地回交进近交中,且用含有Rcg1基因座的近交系生成的杂种会具有增强的或赋予的Cg抗性。还开发了DE811ASR(BC5),并用作用于渐渗Rcg1基因座的改良的供体来源。然后,使用几种其它的近交作为回归亲本,以使用本文所述的标记辅助育种方法有效地将Rcg1基因座渐渗进许多近交和杂种遗传背景中,从而增强或赋予对Cg的抗性。在下面更详细地讨论了每个这样的实施例。
概念的证明(PH09B)
MP305是白色核颜色近交系,它具有强对Cg的抗性,但是它的延迟开花、低产量和弱农艺学特征使它成为在不使用本文所述标记辅助育种方法的情况下差的供体亲本。在表6中提供了MP305的分子标记特性。表中报道的SSR使用的引物可以从可公开得到的序列构建,所述序列见于在环球网上的maizegdb.org(USDA AgriculturalResearch Service主办)的Maize GDB、Sharopova等(Plant Mol.Biol.48(5-6):463-481)和/或Lee等(PlantMol.Biol.48(5-6);453-461)。UMC15a是RFLP标记,且报道的评分是基于EcoR1限制的。
为了证实Rcg1基因座的表型值,首先如下所述将基因座渐渗进系PH09B(美国专利5,859,354),直至BC3阶段。将从MP305和系PH09B之间的杂交衍生的F1群体与系PH09B再回交一次,从而产生BC1群体。种植幼苗,再与系PH09B回交,以形成BC2群体。从 BC2家族的叶子穿孔制备DNA。为了确定种植哪个BC2家族来进一步回交,使用侧接目标区域的标记UMC2041、PHI093和CSU166的引物,对来自BC2家族的DNA进行基因型分析(参见表1)。种植来自BC2家族的种子,并使用与上面提及的相同的3个标记,对个体植物再次进行基因型分析,以确定MP305形式的染色体区域的存在。使阳性植物再与系PH09B回交一次,以形成BC3群体。种植来自这些BC3群体的种子,并将植物自交,以得到对于目标区域分离的BC3S家族以及缺少目标区域的BC3S1家族。将这些家族用于表型对比(对于目标区域分离的BC3S1对比没有目标区域的BC3S1)。
为了观察Rcg1基因在杂合情形(例如在商业杂种中会发现的)下的表现,进行适当的测交。具体地,种植对于目标区域分离的BC3S1家族,并对个体BC3S1植物进行基因型分析。使用每个家族内Rcg1基因纯合的植物以及无效等位基因(缺少2个染色体上的基因)纯合的植物,进行与近交PH2EJ(美国专利6,333,453)、PH2NO(美国专利6,124,533)、PH4CV(美国专利6,897,363)和PH8CW(美国专利6,784,349)的测交。
在BC3S1系和杂种的情况下,观察到的表型差异指示着含有携带Rcg1的区域的系和杂种中ASR抗性的显著提高。渐渗的Rcg1基因座在BC3S1家族和衍生的测交杂种中的作用,导致在受感染的节间数和超过75%受感染的节间数方面的增加。在下面的表5中显示了使用植物育种者常用的视觉评分系统得到的评分。数据清楚地证实,使用杂交技术来将实施方案基因转移进遗传上能使用该基因的其它系中导致增强的对Cg的抗性。
表5:BC3S1家族和衍生的测交中渐渗的Rcg1区域对炭疽病茎腐烂抗性程度的作用
表6:MP305的分子标记特性
作为用于回交的提高最大的供体的DE811ASR(BC5)
尽管MP305用于上面的实验中,但如图8(a)所解释的,DE811ASR(BC5)保留比DE811ASR(BC3)(当然以及MP305)更小的含有Rcg1基因座的MP305染色体区间,且因此特别可用作Rcg1基因的供体来源。已经表明来自DE811ASR(BC5)来源的缩短的染色体区间与提高的农艺学表型相关。在2005年11月至2006年3月,在温室中培养22株来自DE811ASR(BC3)衍生系的植物、20株来自DE811ASR(BC5)衍生系的植物、5株DE811植物和5株MP305植物,并采集植物高度和谷穗高度的数据;50%植物释放花粉的日期(midshed),50%植物具有可看到的谷穗新芽(ear shoots)的日期(midves)和50%植物具有从谷穗新芽突出的穗丝的日期(midslk);并观察核颜色。平均而言,DE811ASR(BC5)系比DE811ASR(BC3)更短(293cm对比345cm),且DE811ASR(BC5)的谷穗的位置比DE811ASR(BC3)更低(146cm对比183cm),它们二者在原种品种开发方面都是阳性性状。与DE811ASR(BC3)相比,DE811ASR(BC5)的midshed、midves和midslk更早。与DE811ASR(BC3)相比,DE811ASR(BC5)的midshed早约1天,midves早约6天,且midslk早约3天。DE811ASR(BC5)的核是微黄棕色(青铜色)颜色,而DE811ASR(BC3)的核具有浅黄色果壳。DE811ASR(BC5)和DE811的midshed、midves和midslk日期类似,而MP305的midshed晚约11天,且没有产生50%可看到的谷穗新芽,在生长时间段也没有50%穗丝。尽管这些数据仅仅是基于少数DE811和MP305植物,且在这少数系上没有产生谷穗,但这些温室结果类似于这些系在田间的观察结果。这些数据表明,DE811ASR(BC5)比DE811ASR(BC3)更接近地类似于DE811回归亲本。因而,DE811ASR(BC5)在基因型和表型上是Rcg1基因座和Rcg1基因的优良起始供体来源。另外,当以类似于DE811的适应向种质中渐渗Rcg1基因座时,DE811ASR(BC5)是特别有用的。
DE811由J.Hawk(Hawk,J.A.(1985).Crop Science Vol 25:p716)开发,且已经被描述为黄色马齿形(dent)近交系,它源自自交和在由B68与源自[B37 Ht X(C103 X Mp3204双杂交)sel.]的近交的杂交繁衍的系谱程序中选择6代。在Delaware的测试中,DE811抽丝比B73晚1-2天,但是在Missouri比B73晚4天。有限的产量试验表明, DE811具有令人满意的配合力。它能良好地抽丝(形成好穗丝,后者是玉米雌花对育性重要的组分)和释放花粉,且可以与早熟种质杂交以适应北美,并与晚熟种质杂交以适应南美。因而,DE811ASR(BC5)与本文公开的标记和育种方法的组合可以用作将Rcg1基因渐渗进多种种质(包括适应存在Cg的所有美国区域的种质)中的原始供体来源。
近交的Rcg1基因座转变的生成
在上述PH09B中测试成功的Rcg1基因座渐渗后,在其它近交系中进行其它Rcg1基因座转变。第一系列具有5次回交,其中使用MP305和DE811ASR(BC5)作为供体。对于第二系列的回交,使用分子标记以减少来自第一系列的BC5转变中的染色体区间。选择这些BC5转变,以用于在Rcg1基因下交换。然后回交那些选择的植物,以生成BC6代。在BC6代中选择具有在该基因上边的交换的植物。
第一系列的回交
在第一系列中,使用DE811ASR(BC5)作为主要供体来源,但是也使用MP305作为供体来源,对相同的近交进行平行渐渗。下面更详细地描述的这些数据证实,尽管DE811ASR(BC5)在许多情况下是优选的供体,但MP305也可以与本文教导的实施方案的标记辅助育种方法一起有效地使用。
选择最初适应北美生长条件的原种近交系用作回归亲本。最初选择的用作回归亲本的近交系是系PH0R8(US 6,717,036)、PH7CH(US6,730,835)、PH705(US 6,903,25)、PH5W4(US 6,717,040)、PH51K(US6,881,881)和PH87P(US 6,888,051)。使每个这样的系与DE811ASR(BC5)杂交,以及与MP305杂交。使源自每个这样的杂交的F1代与各个近交系再回交一次,从而产生第一次回交(回归亲本BC1)世代。将幼苗移植到土地上,并从叶子穿孔制备DNA。使用侧接目标区域的标记的引物,进行PCR反应;UMC1466、UMC1418、BNLG2162、UMC1086、UMC2041、UMC1612、CSU166、UMC1051、UMC2187、UMC1371和UMC1856用于早期BC轮次(参见表1),而在晚期BC轮次中,使用UMC1418、BNLG2162、UMC1051、UMC2041、UMC2187、UMC1371和UMC1856。然后,将PCR反应产生阳性结果(意味着存 在MP305衍生的Rcg1基因座)的幼苗进一步与各个近交系回交,以制备BC2。该操作称作“基因型分析”,鉴别出在特定标记位点的植物基因组成。重复这些步骤,进行回归亲本BC3、BC4和BC5开发。分析表明,5次回交后,这些系保留了显著截短的包含Rcg1基因座的染色体区间,且基于视觉观察,没有观察到由于Rcg1基因座的存在而产生的负面作用的迹象。
还通过选择表型上最像回归亲本的植物,进行回归亲本选择。使用这些基因型和表型方法,用在整个基因组间高百分比的回归亲本,选择高品质转变。
该实施例也说明,侧接标记没有排它地用于选择Rcg1基因或者远离Rcg1基因选择。然后,将PCR反应产生阳性结果(意味着存在MP305衍生的Rcg1基因座)的幼苗进一步与各个近交系回交,以进行第一系列中的最终回交(回归亲本BC5代)。当最接近的侧接多态标记确定该基因存在时,使用离该基因更远的下一组双侧接多态标记进行回归亲本选择。因而,侧接Rcg1基因或Rcg1基因座的标记的应用,可以用于解释在该区域中发生的重组。
第二系列的回交
然后,将在第一系列回交中使用侧接Rcg1基因座的SSR制备的近交Rcg1基因座转变,用作下一个回交轮次的供体。对于该系列的回交,为Rcg1基因开发SNP标记,其能以高通量方式实现标记辅助选择,如实施例13所述,以选择Rcg1基因。还在Rcg1基因座周围的区域中设计SNP标记,从而允许将侧接标记用于远离Rcg1基因座周围的MP305染色体区间选择,和选择回归亲本基因型,从而显著减少连锁拖曳。仅仅通过物理作图和克隆该基因,这样精确的标记辅助回归亲本选择是可行的。
首先,用更精确的标记集合重新筛选从第一系列回交产生的回归亲本BC5植物,并选择在Rcg1基因南边的重组。将紧密与Rcg1基因连锁的侧接标记(MZA8761、MZA1851、UMC1051和UMC2187)用于在约40后代的小群体大小中选择在该基因南边的回归亲本(参见图8(a-b))。然后,使用本文公开的FLP标记,分析这些后代,以更精确地确定重组点。该数据表明,选择的有些后代含有在Rcg1基因 南边小于1cM的回归亲本基因组(基于IBM2相邻遗传学图距),如图8(b)所示。其它后代含有在Rcg1基因南边小于4cM的回归亲本基因组。然后,将这些标记-选择的BC5转变用作供体,并与作为回归亲本的PH705、PH5W4、PH51K和PH87P的近等基因副本杂交,以产生BC6群体。再次将Rcg1基因中的标记用于选择Rcg1,这次在Rcg1北边的侧接标记用于选择回归亲本。在这轮选择中,在每个群体中,在Rcg1和标记MZA15842之间检测到重组。使用相对于侧接标记UMC2285和PHI093的回归,从它在图7(b)、图B所示的高分辨率图上的位置,可以外推MZA15842在IBM2相邻遗传学图上的位置。这将在520.5cM处的MZA15842置于IBM2相邻遗传学图上。因此,如图8(b)所示,在2轮回交中,每个群体中的供体基因组减小至小于6cM的区段,或小于染色体4的0.8%,这基于IBM2相邻遗传学图距,且在有些后代中,该区段小于2.1cM,或小于染色体4的0.25%。为了对比,DE811ASR(BC3)内含有Rcg1基因座的MP305染色体区间是131cM,或染色体4的约16%,这基于IBM2相邻遗传学图距。仅仅通过物理作图和克隆该基因,这样精确的且有效的标记辅助回归亲本选择是可行的。
进一步的分析
因此,作为精细对Rcg1基因位置作图的结果,人们可以使用与Rcg1基因遗传连锁的任意2个侧接标记来选择含有在Rcg1基因北边和南边的交换的小染色体区域。这具有减少连锁拖曳的优点,当尝试将来自未适应的种质(例如MP305)的特定基因渐渗进原种种质(例如上述的近交系)中时,它可能是致混淆因素。图7和22和表16显示了可以用于该目的的侧接Rcg1基因和基因座的标记的许多组合。可以用于选择包含Rcg1基因或基因座的截短的染色体区间的有些特异性的侧接标记是UMC2285和UMC15a、UMC2285和UMC2187、UMC1086和UMC2200、UMC2041和UMC2200、UMC2041和PHI093、MZA11455和UMC15a、MZA11455和MZA3434、MZA15842和MZA3434和FLP8和FLP33。任选地,在每个这样的染色体区间上或内部,人们可以使用至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或更多个标记,以定位重组事件和选择具有最 大量的回归亲本基因型的Rcg1基因或Rcg1基因座。此外,在这样的染色体区间的北末端和Rcg1基因的顶端之间和/或在这样的染色体区间的南末端和Rcg1基因的底端之间,可以有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个标记。
具有用于选择基因的紧密连锁的侧接标记是有利的,且具有在基因本身内的标记是非常有利的。这是胜过使用单个标记或远距离侧接标记的改进,因为使用单个标记或远距离侧接标记,可能会破坏与Rcg1相关的连锁,且通过选择这样的标记,人们更可能不经意地选择不含有Rcg1基因的植物。因为一旦已经确认标记-性状关联,就经常使用标记辅助选择来代替表型选择,所以这样的错误的不幸结果将是,选择不抗Cg的植物和抛弃抗Cg的植物。在这点上,在Rcg1基因内的标记是特别有用的,因为它们根据定义将保持与该基因增强或赋予的对Cg的抗性的连锁。此外,出于类似的原因,在Rcg1基因座内的标记同样有用。由于它们非常接近Rcg1基因,所以它们非常可能保持与Rcg1基因的连锁。一旦渐渗该Rcg1基因,这样的原种近交就可以用于杂种种子生产和用作将Rcg1基因进一步渐渗进其它近交系的供体来源。
因而,数据清楚地表明,使用DE811ASR(BC5)作为供体来源转化的近交后代保留截短的MP305染色体区间。包含截短的MP305染色体区间的近交本身非常适用作供体来源,且不需要回复到作为供体来源的DE811ASR(BC5)。通过使用本文所述的标记辅助育种,可以根据需要进一步减小截短的MP305染色体区间的大小,而无需担心丧失标记和Rcg1基因之间的连锁。表型上,减小的染色体区间与提高的农艺学性能相关联,如上述的DE811ASR(BC5)和DE811ASR(BC3)的对比所证实的。
实施例6
使用Rcg1作为转基因来生成抗性玉米植物
Rcg1基因也可以表达为转基因,从而允许在不同环境下调节它的表达。下面的实施例显示了如何以不同方式表达Rcg1基因,以对抗不同的疾病或保护植物的不同部分,或简单地将Rcg1基因作为转基因移动进不同玉米系中,作为实施例5所述方法的替代方案。
实施例6a:
在本实施例中,使用它自己的启动子,表达Rcg1基因。使用相同的BAC,对Rcg1基因的上游区域测序,所述BAC在实施例2中提供该基因的蛋白编码段的序列。在SEQ ID NO:24中,描述了在ATG 5’的1684bp的序列。
为了转化完整的Rcg1基因,包括启动子和蛋白编码区,使用BAC克隆#24(pk257m7)作为模板DNA,PCR扩增从SEQ ID NO:137的位置41268延伸至位置47176的5910bp片段。为了实现使用Gateway 技术(Invitrogen,Carlsbad,USA)的克隆,通过GatewayBP重组反应,将attB位点掺入PCR引物,并将扩增的产物克隆进pDONR221载体。通过GatewayLR重组反应,将得到的侧接attL位点的片段移动进二元载体。然后,将构建体DNA用于实施例7所述的玉米转化。
实施例6b:
为了在整个植物中低水平地表达Rcg1基因,将基因编码区和它的终止子置于稻肌动蛋白基因(美国专利号5,641,876和5,684,239)或F3.7基因(美国专利5,850,018)的启动子的后面。为了实现使用Gateway技术(Invitrogen,Carlsbad,USA)的克隆,将attB位点整合入PCR引物,后者用于扩增从其起始密码子上游35bp开始的Rcg1基因。将NotI位点加入attB1引物。通过GatewayBP重组反应(Invitrogen,Carlsbad,USA),将扩增的Rcg1产物克隆进pDONR221载体。克隆后,给得到的Rcg1基因侧接attL位点,且其在起始密码子上游35bp处具有独特的NotI位点。此后,使用含有NotI位点的引物,PCR扩增启动子片段。将每个启动子融合到Rcg1的NotI位点上。在最后一步中,通过GatewayLR重组反应(Invitrogen,Carlsbad,USA),将嵌合基因构建体移动进二元载体PHP20622。将它用于实施例7所述的玉米转化。
实施例6c:
为了在整个植物中高水平地表达Rcg1基因,将基因编码区和它的终止子置于玉米遍在蛋白基因的启动子、5’非翻译区和内含子的后面 (Christensen等(1989)PlantMol.Biol.12:619-632;Christensen等(1992)Plant Mol.Biol.18:675-689)。为了实现使用Gateway技术(Invitrogen,Carlsbad,USA)的克隆,将attB位点整合入PCR引物,后者用于扩增从起始密码子上游142bp开始的Rcg1基因。使用GatewayBP重组反应(Invitrogen,Carlsbad,USA),将扩增的产物克隆进pDONR221(Invitrogen,Carlsbad,USA)。克隆后,给得到的Rcg1基因侧接attL位点。在最后一步中,通过GatewayLR重组反应(Invitrogen,Carlsbad,USA),在遍在蛋白表达盒后面,将Rcg1克隆移动进载体中,所述载休包含Christensen等(同上)所述的玉米遍在蛋白启动子、5’非翻译区和遍在蛋白基因的第一个内含子,后面是用于插入Rcg1基因的GatewayATTR1和R2位点。该载体也含有适用于玉米转化的标记基因,所以得到的携带嵌合基因(玉米遍在蛋白启动子-遍在蛋白5′非翻译区-遍在蛋白内含子1-Rcg1)的质粒适用于实施例7所述的玉米转化。
实施例6d:
为了茎-优选地、低水平地表达Rcg1基因,将基因编码区和它的终止子置于Br2基因启动子的后面(美国申请系列号10/931,077)。使用实施例6b所述的含有侧接attL位点的Rcg1编码区、且含有在Rcg1起始密码子上游35bp处的独特NotI位点的片段,实现使用Gateway 技术(Invitrogen,Carlsbad,USA)的克隆。使用含有NotI位点的引物,PCR扩增Br2或ZM-419的启动子片段。将每个启动子融合到Rcg1的NotI位点。在最后一步中,通过GatewayLR重组反应(Invitrogen,Carlsbad,USA),将嵌合基因构建体移动进二元载体PHP20622。将它用于实施例7所述的玉米转化。
实施例7
土壤杆菌属-介导的玉米转化和转基因植物的再生
如下使用在实施例6a和6c中制备的重组DNA构建体,来制备转基因玉米植物。
使用Zhao(美国专利号5,981,840和PCT专利公开W098/32326)的方法,用实施例6a和6c所述的选择的多核苷酸构建体转化玉米。 简而言之,从玉米分离未成熟的胚,并使胚接触土壤杆菌属悬浮液,其中所述细菌能将多核苷酸构建体转移至至少一个未成熟的胚的至少一个细胞中(步骤1:感染步骤)。在该步骤中,将未成熟的胚浸没在土壤杆菌属悬浮液中,用于开始接种。将胚与土壤杆菌属共培养一段时间(步骤2:共培养步骤)。在感染步骤后,在固体培养基上培养未成熟的胚。在该共培养时间段后,进行任选的“休眠”步骤。在该休眠步骤中,在有至少一种已知抑制土壤杆菌属生长的抗生素存在下,温育胚,而不加入植物转化体的选择剂(步骤3:休眠步骤)。在含有抗生素、但是不含有选择剂的固体培养基上培养未成熟的胚,以消除土壤杆菌属,并使感染的细胞进入休眠期。接着,在含有选择剂的培养基上培养接种的胚,并回收生长的转化的愈伤组织(步骤4:选择步骤)。然后,将愈伤组织再生成植物(步骤5:再生步骤),并在固体培养基上培养在选择培养基上生长的愈伤组织,以再生植物。
实施例8:转基因值物评价
分别使用实施例6a和6c所述的构建体,如实施例7所述制备转基因植物。对于天然Rcg1基因和遍在蛋白Rcg1基因构建体,生成30个独立的事件和10个仅载体的对照事件。
收获每个天然基因转基因事件的叶盘,用于总RNA分离。使用SEQ ID NO:37和38所述的基因特异性的引物FLP111F和FLP111R,进行RT-PCR。在30/30个转基因事件中,存在预期的637bp RT-PCR带,从而指示天然基因构建体的表达。在温室中,在相同的30个天然Rcg1转基因事件上进行疾病测定,以确定植物是否抗Cg。为此,首先使用实施例10所述的操作,对每个事件的5个姊妹株植物进行叶斑病测定。发现单个事件会表现出比缺少天然Rcg1基因构建体的对照植物显著的疾病减少。使已经进行叶斑病测定的植物在开花后发育2周,然后通过将Cg接种进第一个伸长的茎节间,进一步测试。这些茎感染测定显示了当与对照植物相比较时,对Cg感染更高抗性的表达天然Rcg1转基因的单个转基因事件。但是,该事件不同于通过叶子感染测定鉴别出的阳性事件。
以类似的方式,分析用实施例6c所述的遍在蛋白Rcg1构建体转化的植物。RT-PCR分析表明,28/30的转基因事件包含预期的转录 物带,从而指示着遍在蛋白Rcg1构建体的表达。当在来自30个事件中的每一个事件的5株植物上进行叶子感染测定时,鉴别出单个事件,它表现出比对照植物统计学上显著减少的疾病。通过茎感染测定,进一步分析转基因植物。当与缺少遍在蛋白Rcg1基因的对照植物相对比时,发现3个事件表现出增加的对茎腐烂的抗性。这些转基因事件不包含在叶斑病测定中鉴别出的从前的阳性事件。
认为这些试验的结果会支持表现出一些抗性、但是总体上由于几个原因不确定的事件。在叶斑病测定中表现出增强的疾病抗性的阳性事件不能与通过茎感染测定鉴别出的那些相关联。这与DE811ASR(BC5)阳性对照相反,后者在叶斑病和茎感染测定中表现出相对于DE811明显的抗性增加。另外,初级转基因的测定表现出比DE811或DE811ASR(BC5)对照的测定更高程度的变异性。这经常在复制品以及阴性的对照事件中观察到。后一种观察结果可以使阳性和阴性事件的区别变得困难。疾病测定结果的不确定性质的可能的原因包括、但不限于下述原因。本领域技术人员众所周知,组织培养衍生出的转基因植物,表现出比种子衍生的对照植物更大的植株间变异性。此外,初级转化体(即通过实施例7所述的转化和再生方法产生的植物)中的基因表达,由于组织培养操作的应激,经常是不可预测的。实际上,如果事件是阴性的(在这点上不能确定),该情况是这样有几个技术原因。进行的测定也不能确定Rcg1基因编码的蛋白是否实际上存在于转基因系中——使用RT-PCR,仅能测定预测的mRNA区段的存在。在转化过程中可能将人为产物导入了基因盒——没有进行广泛的DNA印迹或测序来测定转基因系中整个构建体的完整性。为了更仔细地研究这些转基因系,可以在野外条件下以更大的数目培养较后世代的植物,并测定疾病抗性。预期这些将来的转基因植物将更清楚地表现出增加的对Cg的抗性。
实施例9
种质间Rcg1基因分布的分析和Rcg1序列变体的鉴别
对Rcg1鉴别、测序和精细作图后,筛选其它系的Rcg1基因。为了确定Rcg1基因在其它玉米种质中的存在,通过聚合酶链反应,使用基因特异性的引物组合FLP111F和FLP111R以及FLP113F和 FLPA1R来从玉米近交系(包括表18列出的那些系和F2834T)的不同组中扩增基因组DNA。仅在玉米近交系组的14株(包括MP305)中,检测到扩增产物,从而表明Rcg1基因在筛选的近交系中仅仅以非常小的百分比存在。因而,除了使用MP305或DE811ASR(BC5)作为供体来源以外,含有Rcg1基因的其它来源也可以用作供体来源。例如,公开的含有Rcg1基因的近交系TX601(可在ID‘Ames 22763’下从国家植物种质系统(NPGS)得到)和F2834T(可在ID’Ames 27112’下从NPGS得到)可以用作供体来源,与不含有Rcg1基因的其它玉米近交系杂交,并使用本文所述的标记来选择Rcg1基因。
还鉴别了Rcg1基因的变体,并分析单核苷酸多态性(SNP)。在与413、958、971、1099、1154、1235、1250、1308、1607、2001、2598和3342中的一个或多个位置相对应的序列ID号1上的位置处,鉴别出SNP。(参见表7)。并非Rcg1基因的所有等位基因变体都指示着抗性表型。因此,这些SNP可以用作标记,来精确地鉴别和追踪植物育种程序中的Rcg1序列,和区别抗性和易感的等位基因变体。此外,这些SNP表明,存在表现出抗性表型,且可以用于本文公开的方法和产物中的变体序列。还已经发现4种其它系含有Rcg1等位基因:BYD10、7F11、CML261和CML277。10株植物的测试没有提供足够的数据来明确地确定系7F11是否是抗性的。关于BYD10、CML261和CML277系的抗性,没有得到数据,且还没有完成这些等位基因的测序。
实施例10
含有Rcg1基因的系对炭疽病-诱导的叶斑病是抗性的
使用下述方法,测试实施例1所述的近等基因系DE811和DE811ASR对Cg造成的叶斑病的抗性的差异。将4个普通的家用缝衣针粘贴到金属支持物上,从而使线孔从金属片延伸出来,所有4个针延伸相同的距离。将该装置浸在5×106孢子/mL的Cg孢子悬浮液中,然后使它穿过嫩玉米叶子的表面,从而使叶子受伤,同时给伤口接种孢子。将湿棉拭置于接种位点附近的中脉上,并给整个区域覆盖塑料膜,在其上覆盖反射布,二者都用带子固定,以保持湿润和阴暗。在标准的温室中,使植物保持在该状态50-54小时,此后去除带子、布和塑料膜。在接种后第7和15天,测量损伤的大小,并以平方厘米为单位记录。
图10(a-b)显示了所有各个叶子上在接种后15天的损伤大小分布。损伤大小在每个数据组中有变化,但是实际上所有DE811叶子(图10b)都具有比在DE811ASR(BC5)叶子上发现的最大损伤(图10a)明显更大的损伤大小。在图11中,总结了接种后7天和15天数据组的数据。在7和15天时,携带Rcg1基因的叶子上的平均损伤大小更小。随着真菌有时间生长并造成进一步损伤,差异随着时间推移变得更大,从而尽管在7天时差异是约2倍,但不迟于15天,差异超过4倍,且实际上真菌在DE811ASR(BC5)叶子上仅仅产生了微小的进展。这些结果清楚地证实,含有Rcg1基因的基因座的存在,赋予对炭疽病叶斑病的抗性。
实施例11
当感染了禾生毛盘孢时,从DE811ASR(BC5)衍生的杂种系具有比从DE811衍生的杂 种更高的产量
为了证实含有Rcg1基因的玉米杂种在感染Cg时具有比不含有Rcg1的杂种系DE811ASR(BC5)和DE811更高的产量潜力,将实施例1所述的等基因系分别与近交系B73Ht和Mo17Ht杂交,后二者都对Cg易感。
在2005年,在美国的5个不同州的6个位置,培养杂种系,并评价对Cg的反应。对于每个杂种系,以约74,000株植物/公顷,一式三 份地种植4行。在开花后约10天,在茎基部给植物接种Cg。通过测定接种后4-5周对Cg的反应,评价每个4行样地中的第一行,以确定接种是否成功。劈开茎,并通过观察沿茎生长时的真菌的特征黑色,对疾病的进展评分。如Jung等(1994)Theoretical and AppliedGenetics,89:413-418)所述,进行疾病分级。在前5个节间,记录变色大于75%的节间的总数(antgr75)(参见图20)。这提供从0至5的疾病评分,0表示没有超过75%变色的节间,且5表示前5个节间完全变色。通过在生理成熟时合并收割中心的2块样地,并测定以kg/ha计的谷粒产量。
对所有位置总结的结果显示在图12(对于疾病严重性)和图13(对于产量)中。数据表明,含有Rcg1的杂种(DE811ASR(BC5)/B73Ht和DE811ASR(BC5)/Mo17Ht)具有比不含Rcg1的杂种(DE811/B73Ht和DE811/Mo17Ht)轻的多的疾病进展。易感杂种(缺少Rcg1)中疾病进展的高评分显示了Cg实验的成功感染。此外,数据表明,当感染Cg时,含有Rcg1的杂种具有比缺少Rcg1的杂种更高的产量。单个的逐对对比的差异是显著的,P<0.05。
这些结果清楚地证实,通过使用实施方案的方法,人们可以生成杂种,当感染Cg时,每公顷会产生更多kg的谷粒。
实施例12
从DE811ASR(BC5)或MP305衍生出的近交和杂种Rcg1基因座转变对禾生毛盘孢诱 导的茎腐烂是抗性的
为了证实可以使商业化的玉米系对Cg-诱导的茎腐烂是抗性的,将MP305和DE811ASR(BC5)与PH87P、PH5W4和PH705杂交。将得到的后代再与相同的3个系(即,用作回交程序中的回归亲本的系)杂交另外3次,每次使用上面实施例5所述的分子标记,选择Rcg1基因的存在。作为对照,还从相同的回交程序收集缺少Rcg1基因的选择的回交系。完成3次回交后,选择几个形式并自交,以得到BC3S1家族。将单个BC3S1植物进行基因型分析,并使对Rcg1纯合阳性和纯合阴性的植物自交,以得到BC3S2家族,然后将其进行表型分析。在每行含有约25株植物的单行样地中,种植含有Rcg1的BC3S2形式,和作为对照的不含有该基因的选定形式。在美国5个不同州的5 个不同位置种植试验,命名为位置1、2、3、4和5。在开花后约2周,在茎基部给植物接种Cg。4-5周后,劈开茎,通过肉眼估计茎中的疾病量,评价疾病的进展。基于接种节间和接种节间上面的4个节间中每个节间的感染程度,给每个茎分配视觉评分。低评分因而指对疾病的抗性。所有行和位置的汇集结果总结在图14中。2个系的代表性图片如图15和16所示。数据表明,在所有位置,Rcg1基因的存在使得每个原种近交系更抗疾病。
卖给农民的玉米种子是“杂种”,意味着它最常见地是2个近交亲本杂交的结果,称作单交杂种。多年的育种和生产经验已经表明,单交杂种的使用产生更高的产量。因而,对于商业化应用重要的是杂种植物(农民的生产地中的那些)中的Rcg1基因功能,甚至当它存在于用于制备单交杂种种子的2个亲本中的仅一个中时。因而,通过与不携带Rcg1基因的原种近交PH4CV杂交,将已经杂交进Rcg1系的近交系之一PH705用于制备杂种种子。将得到的杂种种子用于与上面讨论的为近交系描述的试验相同的试验中,并以相同方式,在所有5个位置评分。在图17中总结了所有位置的数据,它也显示了近交PH705的性能,且代表性图片显示在图18和19中。可以看出,在杂种PH705×PH5W4的所有位置,和在PH705×PH87P的5个位置,都观察到疾病进展的明显差异。在第五个位置,环境条件对植物生长是非常应激的,从而导致植物处于差的条件下。在这些条件下,植物疾病抗性的测量经常是不可靠的。
近交系和含有Rcg1的杂种组合的结果清楚地证实,使用实施方案的方法,人们可以制备商业上有用的抗Cg-诱导的茎腐烂的系。
实施例13
Rcg1编码序列内的标记,Rcg1基因座内的标记位置和设计,和用干侧接染色体区 域的单元型
作为对Rcg1基因精细作图和克隆的结果,可以使用3个水平的标记位置,在Rcg1编码序列内设计的标记、在鉴别Rcg1基因座的非同线性区域内设计的标记(但是在Rcg1编码序列外)和在侧接同线性区域内设计的标记。
在Rcg1编码序列内的标记
在对Rcg1基因鉴别和精细作图后,设计将对SNP平台起作用的杂交标记。由于Rcg1基因发生在玉米基因组的非同线性区域,所以杂交标记将存在于包含Rcg1基因的系中,且在不包含Rcg1基因的系中不存在。这些标记鉴别SEQ ID NO:1中列出的Rcg1编码序列特异的多核苷酸序列。如表7所示,存在含有SEQ ID NO:1所述的Rcg1编码序列变体的其它玉米系,且这些标记也设计用于鉴别这些Rcg1编码序列变体。
为此,生成来自不同来源的变体Rcg1编码序列的共有序列图,如表7所示。该共有序列图比对了从MP305分离的Rcg1编码序列的4209个碱基和来自PHBTB的3451个碱基以及来自PH26T的3457个碱基。PHBTB和PH26T中的Rcg1基因表现出对炭疽病的抗性。接着,对包含NT(来自NCBI的公开可得的DNA)的几个数据库BLASTRcg1编码序列的区段,且将最高同源性命中值(hit)与Rcg1共有序列比对,以确定与NBS-LRR家族中的其它抗性基因共有高同源性且具有共同区段的区段。选择Rcg1编码序列特有的且在Rcg1的不同来源共有的区域,用于标记设计。具体地,由于FLP111F和FLP111R引物产生单个扩增子,后者可靠地诊断出来自不同来源的Rcg1的存在,所以靶向FLP111F和FLP111R杂交的区域,以用于开发SNP标记设计。
使用来自含有2个引物位点的共有序列的1413bp区段,设计InvaderTM(Third WaveTechnologies,Madison,WI)标记,其中靶定引物区本身进行探针和InvaderTM寡核苷酸杂交。在每个探针位点周围设计引物,以产生大小小于150bp的扩增子。该标记指示着由于杂交具有荧光的Rcg1编码序列的存在,其中Rcg1编码序列的不存在导致没有荧光。通过设计与第二个高度保守的玉米基因杂交的标记,从而使得Rcg1编码序列的存在产生2种染料的荧光(Rcg1和保守基因),且Rcg1的不存在产生仅保守基因的荧光,也可以产生对照荧光信号。通过区分实际上不存在Rcg1的情形和由于反应失败已经发生假阴性的情形,该“对照”荧光可以用于减少实验室误差。这样的标记不限于特定的标记检测平台。Taqman标记(Applied Biosystems)也设计在相同的位置(引物对FLP111F和FLP111R),其用作InvaderTM标记。标记显示在表15和图23和24中。
在多种来源中测试标记设计C00060-01-A和C00060-02-A,且其在鉴别含有Rcg1基因座和Rcg1基因的植物方面是非常成功的,无论Rcg1基因座或Rcg1基因的来源。还针对已知不携带该基因的接近100个不同的近交系的对照组,使用这些标记,且在对照组中没有检测到荧光。证实了其中标记设计C00060-01-A和C00060-02-A的一个或两个含有Rcg1的植物,包括表7所示的那些。
因此,该实施例表明了,基于本文提供的教导,可以构建出鉴别许多来源中的Rcg1编码序列的标记。
在Rcg1基因座内的标记
除了使用在Rcg1编码序列本身内的标记或作为替代,可以设计Rcg1基因座的标记。Rcg1编码序列和非同线性区域之间的紧密物理距离使得通过重组可丧失在非同线性区域内、但是在Rcg1编码序列之外的标记之间的连锁为不可能。关于Rcg1编码序列的标记,显示存在或不存在的标记足以鉴别出Rcg1基因座。
为了设计该区域的标记,对包含Rcg1基因的非同线性区域和在Rcg1基因正北的区域的64,460bp区段进行测序。将该序列中的BAC分解成长度为约800核苷酸的亚克隆,并测序。然后,装配这些序列,以构建BAC序列,并鉴别基因区域和重复区域。鉴别出重复区域,以避免将标记置于重复区域中。类似地,通过简单的BLAST搜索,可以容易地避免与已知的玉米序列具有高同源性的序列。避免含有SSR、A、T或G串的潜在序列,或会导致产生低GC含量(这会在InvaderTM平台内造成问题)的探针的潜在序列。参见图9(b)和表17。
然后将选择的区段置于Invader CreatorTM软件(Third Wave,Madison,WI)中,其产生InvaderTM反应的寡核苷酸。这生成所有SNP的有义和反义设计。选择具有最好评分且没有罚分的有义设计。尽管已经设计了这些标记,但尚未测试它们。
使用Primer3(Steve Rozen和Helen J.Skaletsky(2000)Primer3available onthe world wide web for general users and for biologistprogrammers见:KrawetzS,Misener S(eds)Bioinformatics Methods andProtocols:Methods in MolecularBiology.Humana Press,Totowa,NJ,pp 365-386),设计引物。选择在InvaderTM组分之外的引物,并选择长度接近或小于150bp的优选引物。将引物温度和长度调节至对InvaderTM平台最有用,尽管如果使用其它检测平台,可以为在这样平台上的应用优化引物。
在同线性区域中的标记和相关的单元型
紧密连锁的侧接Rcg1基因座的标记可以有效地用于选择已经遗传了来自包含Rcg1基因座的亲本的Rcg1基因座的后代植物。本文所述的标记,例如表16上列出的那些,以及遗传地或物理地作图到相同染色体区段的其它标记,可以用于选择包含Rcg1基因座的截短的染色体区段。一般地,将使用在该基因上边的侧接区中的这些标记的集合(例如,2或更多个、3或更多个、4或更多个、5或更多个),和在该基因下边的侧接区中的类似集合。任选地,如上所述,也可以使用在Rcg1基因和/或Rcg1基因座内的标记。筛选亲本和它们后代中的这些标记集合,且在2个亲本之间多态的标记用于选择。使用离Rcg1基因或Rcg1基因座最近的多态标记来选择该基因或基因座,且使用更远的多态标记来对着该基因或基因座进行选择。在渐渗程序中,这允许选择在更近的多态标记处的Rcg1基因或Rcg1基因座基因型,和选择在更远多态标记处的回归亲本基因型。如上面实施例5中更详细地描述的,该方法允许有效地选择包含Rcg1基因座的截短的染色体区段。
上述方法需要在杂交中使用的亲本基因型的知识。任选地,可以使用单元型,从而无需首先基因型分析在杂交中使用的特定亲本,选择Rcg1基因或Rcg1基因座。这是选择Rcg1基因座的高效方式,尤其在不使用在Rcg1基因或Rcg1基因座内的标记时。
用标记筛选要用于育种程序(例如基因渐渗程序)的所有植物。可以使用在相同染色体区段上的本文公开的标记或等价标记。注意到植物单元型(连锁不平衡的一系列SNP或其它标记)。将在Rcg1基因座周围的抗性植物的单元型与要使用的不包含Rcg1基因座的其它植物的单元型相对比。然后,将在Rcg1基因座周围的抗性植物特有的单元型用于选择,且该单元型将特异性地鉴别来自含有Rcg1基因座的抗性植物的染色体区段。
基于MP305和数百个玉米系(包括表18所示的50个公开可得的玉米系)的不同集合的分析,鉴别出含有Rcg1基因座的MP305染色体区段的特有SNP单元型。该SNP单元型独特地鉴别出在MZA3434、MZA2591和MZA11123中延伸的MP305染色体区段。参见图22,SEQ ID NO:140、141和142,和表8、9和10。
首先,将表2所述的这3个MZA的引物对用于鉴别单元型。引物对MZA3434E正向和反向用于扩增玉米系集合的基因组DNA。通过用MZA3434 I正向和反向引物对扩增,进一步纯化PCR片段。对于MZA2591和MZA11123,重复该过程。在正向和反向方向测序得到的PCR片段,并比对序列,以产生共有序列(参见SEQ ID NO:140、141和142所述的序列)。在表8、9和10中,显示了在这些共有序列内的SNP和插入/缺失。在基因型集合中,对比这些SNP和插入/缺失。
关于MZA3434,单元型8是罕见的单元型等位基因,且是MP305和仅一个其它玉米系特有的。对于MZA2591,重复该过程,且发现MP3 05在MZA2591处具有单元型2,仅2个其它玉米系共有它。MP305是具有在MZA3434处的单元型8和在MZA2591处的单元型2的唯一玉米系,且因此,这2个单元型(在MZA3434处的单元型8和在MZA2591处的单元型2)的组合,独特地鉴别包含Rcg1基因座的MP305染色体区域。MP305也具有在MZA11123处的可提供信息的单元型。发现MP305具有单元型7,它是66个其它玉米系共有的,但是这些玉米系都不具有在MZA3434处的单元型8或在MZA2591处的单元型2。因此,在MZA3434、MZA2591或MZA11123处的2个单元型的任意组合,可以用于独特地鉴别这些基因型中的MP305。然后,可以通过对片段测序或通过设计片段内的每个SNP或插入/缺失的标记,查询单元型。
单元型内的多态性可以用于标记单元型。所谓的‘标记-SNP’或‘单元型-标记’在植物育种中是非常有用的,因为通过外推到单元型,可以确定比多态性本身更多的信息。单元型也可以定义为序列之间的一系列多态性,且它们可以称作‘大范围单元型’。
在可以用作‘单元型标记’的单元型内,观察到了罕见的多态性。例如,SNPMZA2591.32(等位基因c)或MZA2591.3 5(等位基因t)可以用于标记在MZA2591处的单元型2,且与单元型2一样,二者都 是MP305和2个其它玉米系独有的。SNP MZA2591.32(等位基因c)和与MZA3434.17(等位基因c)相组合的MZA2591.35(等位基因t)的组合,产生‘大范围’单元型,其可以用于区分MP305和研究中的所有其它基因型。
另外,其它标记MZA15842、MZA11455、MZA8761和MZA1851也表现出与MP305的多态性。对于MZA15842,其它玉米系中仅有18个共有与MP305相同的单元型;对于MZA11455,其它玉米系中仅有43个共有与MP305相同的单元型;对于MZA8761,其它玉米系中仅有约一半共有与MP305相同的单元型;且对于MZA1851,其它玉米系中仅有约一半共有与MP305相同的单元型。开发这些标记的共有序列,且如SEQ ID NO:143-146所述。这些共有序列内的SNP和插入/缺失如表11-14所示。使用MZA标记的独特单元型的4个实例是:
MZA11123(单元型7)
MZA15842(单元型3)
MZA8761(单元型1)
MZA11123(单元型7)
MZA15842(单元型3)
MZA1851(单元型1)
MZA11455(单元型6)
MZA11123(单元型7)
MZA15842(单元型3)
MZA16510(单元型4)
MZA11455(单元型6)
MZA11123(单元型7)
MZA15842(单元型3)
MZA11394(单元型6)。
本文公开的所有标记的多个组合、或该区域内的其它标记,也含有鉴别Rcg1基因座的独特单元型。
表16:包含在定义的染色体区间内的可以用于选择Rcg1的标记公开可得的标记取自IBM2相邻4图,而通过作图到相同遗传学图上,和通过在物理图上的位置,确定Pioneer标记(前缀‘MZA’)的相对位置。
表18:用于单元型分析的公开可得系的列表
<110>E.I.du Pont de Nemours and Company
Pioneer Hi-Bred International,Inc.
University of Delaware
<120>用于制备抗真菌病原体的植物的多核苷酸和方法
<130>1999-PCT
<150>60/668,241
<151>2005-04-04
<150>60/675,664
<151>2005-04-28
<160>232
<170>FastSEQ for Windows Version 4.0
<210>1
<211>4212
<212>DNA
<213>玉蜀黍(Zea mays)
<220>
<221>基因
<222>(0)...(0)
<223>Rcg1的核苷酸序列
<220>
<221>外显子
<222>(143)...(948)
<223>外显子1
<220>
<221>外显子
<222>(1452)...(3588)
<223>外显子2
<220>
<221>内含子
<222>(949)...(1451)
<223>内含子1
<220>
<221>CDS
<222>(143)...(948)
<220>
<221>CDS
<222>(1452)...(3588)
<400>1
aaaaccctca ccacattttc ctcaaccaca tgatggagat tggggctact agatactatg 60
cctggtggta gactggtagc tgatgtcttt ggaccagtag ttggtgctag atttgtgaac 120
tctaccaagg tgagaaacgg ag atg gag gct gcc ctg ctg agc ggg ttc atc 172
Met Glu Ala Ala Leu Leu Ser Gly Phe Ile
1 5 10
aaa acc atc ctg cca agg ctc ttc tca ctg gta caa ggg aga tac aag 220
Lys Thr Ile Leu Pro Arg Leu Phe Ser Leu Val Gln Gly Arg Tyr Lys
15 20 25
ctg cac aag ggc ctc aag agc gac atc aaa tcg ctg gag aaa gag ctc 268
Leu His Lys Gly Leu Lys Ser Asp Ile Lys Ser Leu Glu Lys Glu Leu
30 35 40
cat atg atc gct gtt aca atc gat gaa caa atc tcg ctg ggg agg aag 316
His Met Ile Ala Val Thr Ile Asp Glu Gln Ile Ser Leu Gly Arg Lys
45 50 55
gat cag gga gct gtg ctg agc ctc tca att gat gag ctg cat gaa ctg 364
Asp Gln Gly Ala Val Leu Ser Leu Ser Ile Asp Glu Leu His Glu Leu
60 65 70
gct cac caa atc gag gac tcc ata gat cgc ttc ttg tac cat gtg acc 412
Ala His Gln Ile Glu Asp Ser Ile Asp Arg Phe Leu Tyr His Val Thr
75 80 85 90
agg gag cag caa gca tcc ttt ttt cgt cgg act gta cgg tcg ccg aag 460
Arg Glu Gln Gln Ala Ser Phe Phe Arg Arg Thr Val Arg Ser Pro Lys
95 100 105
act ctg ttg tca cgt cag cgg ctg gct gcc gag gtt cag ttc ctg aag 508
Thr Leu Leu Ser Arg Gln Arg Leu Ala Ala Glu Val Gln Phe Leu Lys
110 115 120
aag ata ccg gag gag gcg cac cag cga gag aag agg tac agg gtc ttc 556
Lys Ile Pro Glu Glu Ala His Gln Arg Glu Lys Arg Tyr Arg Val Phe
125 130 135
gcc ggc ctt tct tcc tct acc cgg cac act gaa tcg tct tcc tgt tcg 604
Ala Gly Leu Ser Ser Ser Thr Arg His Thr Glu Ser Ser Ser Cys Ser
140 145 150
tct gta tct gat ccg cac aca ctt aag gcc gac gtc gtc ggc atc gac 652
Ser Val Ser Asp Pro His Thr Leu Lys Ala Asp Val Val Gly Ile Asp
155 160 165 170
ggt ccc agg gac gag ctt gtg cag cag tta acc gaa gag gca gag ggc 700
Gly Pro Arg Asp Glu Leu Val Gln Gln Leu Thr Glu Glu Ala Glu Gly
175 180 185
cta aca aag cag ctc aag gtg atc tcc atc gtc ggg atc cat ggc tcc 748
Leu Thr Lys Gln Lcu Lys Val Ile Ser Ilc Val Gly Ile His Gly Ser
190 195 200
ggc aag acc gtc ctt gcc aga gag gta tac gag agc gac gtc ggc cgg 796
Gly Lys Thr Val Leu Ala Arg Glu Val Tyr Glu Ser Asp Val Gly Arg
205 210 215
cag ttc agt ctc cgg gca tgg gtt tct gct act gac aga ggt ccg aga 844
Gln Phe Ser Leu Arg Ala Trp Val Ser Ala Thr Asp Arg Gly Pro Arg
220 225 230
gag gtg ctc atg gag atc ctc cga aat ttt ggt agg cca gtg gtg gat 892
Glu Val Leu Met Glu Ile Leu Arg Asn Phe Gly Arg Pro Val Val Asp
235 240 245 250
agc tct agt att gac cag ctt acg gta gat ctc agg aaa cac ttg ggt 940
Ser Ser Ser Ile Asp Gln Leu Thr Val Asp Leu Arg Lys His Leu Gly
255 260 265
gag aaa ag gtgaaaaaaa cctcttcttt atgttattta ttatttatga agtttcttca 998
Glu Lys Ser
actacgggtt ttcatgttca aattgcctct ctgaacttcg aaaacgttta ataccaattg 1058
aattgaggat cttagctttg gaaaagcggt agtgttttga cgttttgcat acatttctca 1118
ccgttatttt attcatttat aatttagagt ttaagcagta tattcatttt gaaatttatg 1178
agatttctgt ctgcacgctt acttccatgc ccaaaacatg tccgattgag aacagaaggt 1238
aattttgttt gatctttgag atcagacaca ctgattgagt agtaacagga aacaagtgct 1298
caccaatcac ccaagtcact tacaaagaat ttcatgctta caaaacacac tgattgttaa 1358
ggatagagac tatgtttgat ctgcatagtt tgaattttga ttatgtcatc gtcgattgtt 1418
atcattaact tttgttggaa atttctcttg tag c tat ttc att gta atc gat 1470
Tyr Phe Ile Val Ile Asp
270 275
ggc atg caa aca gat cag tgg agc acc att gaa act gcc ttc cca gaa 1518
Gly Met Gln Thr Asp Gln Trp Ser Thr Ile Glu Thr Ala Phe Pro Glu
280 285 290
aac aat gtt gtt agc agc aga gta att gtt aca aca aca atc cgg tca 1566
Asn Asn Val Val Ser Ser Arg Val Ile Val Thr Thr Thr Ile Arg Ser
295 300 305
gta gct aat tct tgc agc tct tct aac ggt tat gtg cac aaa atg aaa 1614
Val Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Val His Lys Met Lys
310 315 320
aga ctt agt gac gaa cac tca gag caa ttg ttt atc aag aaa gct tgc 1662
Arg Lcu Ser Asp Glu His Ser Glu Gln Leu Phe Ile Lys Lys Ala Cys
325 330 335
cca aca aaa tat tca ggt tat act cga ccg gaa tca aaa gaa gtt ctg 1710
Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys Glu Val Leu
340 345 350 355
aag aaa tgt gat ggt caa cca ctt gct ctt gtt act atg ggc caa ttc 1758
Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Val Thr Met Gly Gln Phe
360 365 370
ttg agg aaa aat ggt tgg ccc aca gga ccc aac tgc gaa aat gtg tgt 1806
Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu Asn Val Cys
375 380 385
aga gat ctt aga cga cat ctg gag cag gat gat aca ttg gag aga atg 1854
Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu Glu Arg Met
390 395 400
cga agg gtg ctt atc cac agc tta tct agt ctt cct agc cat gtt ccc 1902
Arg Arg Val Leu Ile His Ser Leu Ser Ser Leu Pro Ser His Val Pro
405 410 415
aaa gcc tgc ctt ttg tat ttt ggt atg ttt cca tgt gat cat ccc ata 1950
Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp His Pro Ile
420 425 430 435
aag agg aag agc ctg atg agg cga tgg tta gca gag gga ttt gta caa 1998
Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly Phe Val Gln
440 445 450
aca cag cct tca tct agt gaa aac ttc aac acc ctc ata gac cgg aat 2046
Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu Ile Asp Arg Asn
455 460 465
att att gag ccc atc ggc ata tgt aac gat gat cag gta aag aca tgc 2094
Ile Ile Glu Pro Ile Gly Ile Cys Asn Asp Asp Gln Val Lys Thr Cys
470 475 480
aaa aca tat ggc atg atg cac gag ttc att ttg tta atg tcc acc tcc 2142
Lys Thr Tyr Gly Met Met His Glu Phe Ile Leu Leu Met Ser Thr Ser
485 490 495
cat gac ttc att acc ctg ctt tgt aat aat aaa gtt gaa cac aaa tat 2190
His Asp Phe Ile Thr Leu Leu Cys Asn Asn Lys Val Glu His Lys Tyr
500 505 510 515
gtg cgt cgg ctt tct ctc cat cat cat agt gct aca agt ggc agt ttt 2238
Val Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser Gly Ser Phe
520 525 530
tcg gtc atc gac tta tct ctt gtt aga tct ctg atg gtt ttt ggg gag 2286
Ser Val Ile Asp Leu Ser Leu Val Arg Ser Leu Met Val Phe Gly Glu
535 540 545
gct ggc aaa act att ttg agt ttc cga aag tac gag cta ttg aga gtc 2334
Ala Gly Lys Thr Ile Leu Ser Phe Arg Lys Tyr Glu Leu Leu Arg Val
550 555 560
ttg gat ctt gaa caa tgt acc gac ttg gaa gat gat cac ctc aaa gac 2382
Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His Leu Lys Asp
565 570 575
ata tgc aac ctt ttt ctt atg aaa tat cta agc ctc gga gaa act att 2430
Ile Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly Glu Thr Ile
580 585 590 595
aga agt ctt cca aag gag ata gaa aaa ctg aag ctc ttg gag aca ctt 2478
Arg Ser Leu Pro Lys Glu Ile Glu Lys Leu Lys Leu Leu Glu Thr Leu
600 605 610
gac ttg agg aga aca aag gtg aaa aca cta cct ata gag gtc ctc ctg 2526
Asp Leu Arg Arg Thr Lys Val Lys Thr Leu Pro Ile Glu Val Leu Leu
615 620 625
ctc ccc tgt tta ctc cat ctg ttt ggg aag ttc caa ttt tct gat aaa 2574
Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe Ser Asp Lys
630 635 640
atc aag ata aca agt gac atg cag aag ttt ttc tta act gga cag agt 2622
Ile Lys Ile Thr Ser Asp Met Gln Lys Phe Phe Leu Thr Gly Gln Ser
645 650 655
aac tta gag aca ctt tca gga ttt atc aca gat ggg tct caa gga ttg 2670
Asn Leu Glu Thr Leu Ser Gly Phe Ile Thr Asp Gly Ser Gln Gly Leu
660 665 670 675
cca cag atg atg aat tac atg aat tta aga aag ctt aag ata tgg ttt 2718
Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys Ile Trp Phe
680 685 690
gag agg agt aag aga agc acc aac ttc acc gat ctt gtg aat gct gtc 2766
Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Val Asn Ala Val
695 700 705
caa aag ttc atc cat gat gac aaa gag agc aat gat cca cgt tct cta 2814
Gln Lys Phe Ile His Asp Asp Lys Glu Ser Asn Asp Pro Arg Ser Leu
710 715 720
tca ctt cat ttc gat gac ggc act gaa aac atc ctg aac tct ttg aag 2862
Ser Leu His Phe Asp Asp Gly Thr Glu Asn Ile Leu Asn Ser Leu Lys
725 730 735
gct cct tgt tac ctt agg tca ttg aag tta aaa ggg aat ttg ctg gaa 2910
Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn Leu Leu Glu
740 745 750 755
ctt ccc cag ttt gtc ata tca atg cgg ggt ctc cgg gag ata tgc ctt 2958
Leu Pro Gln Phe Val Ile Ser Met Arg Gly Leu Arg Glu Ile Cys Leu
760 765 770
tca tca aca aaa ttg aca tcg ggc ctc ctt gca aca ctc gct aac ttg 3006
Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu Ala Asn Leu
775 780 785
aaa ggc ttg cag cat ctc aag ctg att gca gat gtc ctt gaa gat ttt 3054
Lys Gly Leu Gln His Leu Lys Leu Ile Ala Asp Val Leu Glu Asp Phe
790 795 800
atc att gaa ggt cag gca ttc ctg ggg ctg cta cac cta tgt ttt gtc 3102
Ile Ile Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu Cys Phe Val
805 810 815
cta gaa cgt gcc acc tta cca ata att gaa gga gga gct ttg ccg tac 3150
Leu Glu Arg Ala Thr Leu Pro Ile Ile Glu Gly Gly Ala Leu Pro Tyr
820 825 830 835
ctc atc tca ctt aag cta atc tgc aaa gat cta gtt ggc ctc ggt gac 3198
Leu Ile Ser Leu Lys Leu Ile Cys Lys Asp Leu Val Gly Leu Gly Asp
840 845 850
atc aaa atc aac cgc ctc aaa tgt ctt aag gaa gtc agt cta gat cat 3246
Ilc Lys Ile Asn Arg Leu Lys Cys Leu Lys Glu Val Ser Leu Asp His
855 860 865
aga gtc gct tcg gaa aca aga gaa atc tgg gaa aaa gct gcc gag aag 3294
Arg Val Ala Ser Glu Thr Arg Glu Ile Trp Glu Lys Ala Ala Glu Lys
870 875 880
cat cca aac cgg ccg aaa gta ttg ttg gtc aac tca tct gat gaa agc 3342
His Pro Asn Arg Pro Lys Val Leu Leu Val Asn Ser Ser Asp Glu Ser
885 890 895
gaa att aag gct gta gac tgt tct gtt gct tca aga cca gct gtg agt 3390
Glu Ile Lys Ala Val Asp Cys Ser Val Ala Ser Arg Pro Ala Val Ser
900 905 910 915
gag gct aat gga act tct ccc atg tca gag gtt gat gta cga gag gat 3438
Glu Ala Asn Gly Thr Ser Pro Met Ser Glu Val Asp Val Arg Glu Asp
920 925 930
gac att cag atg ata ctt aac cag ggg ctc tct gcc gct gct gag aaa 3486
Asp Ile Gln Met Ile Leu Asn Gln Gly Leu Ser Ala Ala Ala Glu Lys
935 940 945
cag atg aat tgt gca gtt cag cca agt tca aaa gct gaa ctg aac tct 3534
Gln Met Asn Cys Ala Val Gln Pro Ser Ser Lys Ala Glu Leu Asn Ser
950 955 960
gat ttc aat aat att agt ttc cca gag gtt gcg ctt ggt tta acc gag 3582
Asp Phe Asn Asn Ile Ser Phe Pro Glu Val Ala Leu Gly Leu Thr Glu
965 970 975
ctg tga attgcttgga attgaaatgt gtcttcatac acctattgat ccttgattgt 3638
Leu *
980
ccatggtcag tttcgttgca cttgcagcat attactatga ggctagtatc atgtaaatta 3698
caaatctttt gttgttaagg ccataaattg catattatag cacaacaagc tggtatgtct 3758
caacaatggc attaattttt tttctgcttg aatctacaaa tttcatcatt attttgcaat 3818
ttcgctttta tacagatatg gtgatgccat gtcattttga ctttgcagca tatatgcaag 3878
caacggtttg agttgctgga gttgctagaa tattgataca acttcagttt actcgaaggc 3938
tacagggatc tcataactag gatggttgaa gataatttgc gattgtttcc ttcagtgtca 3998
ctgaaaagac ttttgtaaca ataaagcata cctttgcttc ctactttttt gaagttactt 4058
cagatgctaa gttcgcagtt gggcctggac tttatcatgt ttatccagct gtttatttgt 4118
ttcatgtaca ataataccgg tgattgctgt tgttatataa tctatattta tactatagtt 4178
aaagtatcag tttcaacggt tgtcccgcgc catc 4212
<210>2
<211>2943
<212>DNA
<213>玉蜀黍(Zea mays)
<220>
<221>基因
<222>(1)...(2943)
<223>Rcg1基因的仅仅编码区
<220>
<221>CDS
<222>(1)...(2943)
<400>2
atg gag gct gcc ctg ctg agc ggg ttc atc aaa acc atc ctg cca agg 48
Met Glu Ala Ala Leu Leu Ser Gly Phe Ile Lys Thr Ile Leu Pro Arg
1 5 10 15
ctc ttc tca ctg gta caa ggg aga tac aag ctg cac aag ggc ctc aag 96
Leu Phe Ser Leu Val Gln Gly Arg Tyr Lys Leu His Lys Gly Leu Lys
20 25 30
agc gac atc aaa tcg ctg gag aaa gag ctc cat atg atc gct gtt aca 144
Ser Asp Ile Lys Ser Leu Glu Lys Glu Leu His Met Ile Ala Val Thr
35 40 45
atc gat gaa caa atc tcg ctg ggg agg aag gat cag gga gct gtg ctg 192
Ile Asp Glu Gln Ile Ser Leu Gly Arg Lys Asp Gln Gly Ala Val Leu
50 55 60
agc ctc tca att gat gag ctg cat gaa ctg gct cac caa atc gag gac 240
Ser Leu Ser Ile Asp Glu Leu His Glu Leu Ala His Gln Ile Glu Asp
65 70 75 80
tcc ata gat cgc ttc ttg tac cat gtg acc agg gag cag caa gca tcc 288
Ser Ile Asp Arg Phe Leu Tyr His Val Thr Arg Glu Gln Gln Ala Ser
85 90 95
ttt ttt cgt cgg act gta cgg tcg ccg aag act ctg ttg tca cgt cag 336
Phe Phe Arg Arg Thr Val Arg Ser Pro Lys Thr Leu Leu Ser Arg Gln
100 105 110
cgg ctg gct gcc gag gtt cag ttc ctg aag aag ata ccg gag gag gcg 384
Arg Leu Ala Ala Glu Val Gln Phe Leu Lys Lys Ile Pro Glu Glu Ala
115 120 125
cac cag cga gag aag agg tac agg gtc ttc gcc ggc ctt tct tcc tct 432
His Gln Arg Glu Lys Arg Tyr Arg Val Phe Ala Gly Leu Ser Ser Ser
130 135 140
acc cgg cac act gaa tcg tct tcc tgt tcg tct gta tct gat ccg cac 480
Thr Arg His Thr Glu Ser Ser Ser Cys Ser Ser Val Ser Asp Pro His
145 150 155 160
aca ctt aag gcc gac gtc gtc ggc atc gac ggt ccc agg gac gag ctt 528
Thr Leu Lys Ala Asp Val Val Gly Ile Asp Gly Pro Arg Asp Glu Leu
165 170 175
gtg cag cag tta acc gaa gag gca gag ggc cta aca aag cag ctc aag 576
Val Gln Gln Leu Thr Glu Glu Ala Glu Gly Leu Thr Lys Gln Leu Lys
180 185 190
gtg atc tcc atc gtc ggg atc cat ggc tcc ggc aag acc gtc ctt gcc 624
Val Ile Ser Ile Val Gly Ile His Gly Ser Gly Lys Thr Val Leu Ala
195 200 205
aga gag gta tac gag agc gac gtc ggc cgg cag ttc agt ctc cgg gca 672
Arg Glu Val Tyr Glu Ser Asp Val Gly Arg Gln Phe Ser Leu Arg Ala
210 215 220
tgg gtt tct gct act gac aga ggt ccg aga gag gtg ctc atg gag atc 720
Trp Val Ser Ala Thr Asp Arg Gly Pro Arg Glu Val Leu Met Glu Ile
225 230 235 240
ctc cga aat ttt ggt agg cca gtg gtg gat agc tct agt att gac cag 768
Leu Arg Asn Phe Gly Arg Pro Val Val Asp Ser Ser Ser Ile Asp Gln
245 250 255
ctt acg gta gat ctc agg aaa cac ttg ggt gag aaa agg tat ttc att 816
Leu Thr Val Asp Leu Arg Lys His Leu Gly Glu Lys Arg Tyr Phe Ile
260 265 270
gta atc gat ggc atg caa aca gat cag tgg agc acc att gaa act gcc 864
Val Ile Asp Gly Met Gln Thr Asp Gln Trp Ser Thr Ile Glu Thr Ala
275 280 285
ttc cca gaa aac aat gtt gtt agc agc aga gta att gtt aca aca aca 912
Phe Pro Glu Asn Asn Val Val Ser Ser Arg Val Ile Val Thr Thr Thr
290 295 300
atc cgg tca gta gct aat tct tgc agc tct tct aac ggt tat gtg cac 960
Ile Arg Ser Val Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Val His
305 310 315 320
aaa atg aaa aga ctt agt gac gaa cac tca gag caa ttg ttt atc aag 1008
Lys Met Lys Arg Leu Ser Asp Glu His Ser Glu Gln Leu Phe Ile Lys
325 330 335
aaa gct tgc cca aca aaa tat tca ggt tat act cga ccg gaa tca aaa 1056
Lys Ala Cys Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys
340 345 350
gaa gtt ctg aag aaa tgt gat ggt caa cca ctt gct ctt gtt act atg 1104
Glu Val Leu Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Val Thr Met
355 360 365
ggc caa ttc ttg agg aaa aat ggt tgg ccc aca gga ccc aac tgc gaa 1152
Gly Gln Phe Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu
370 375 380
aat gtg tgt aga gat ctt aga cga cat ctg gag cag gat gat aca ttg 1200
Asn Val Cys Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu
385 390 395 400
gag aga atg cga agg gtg ctt atc cac agc tta tct agt ctt cct agc 1248
Glu Arg Met Arg Arg Val Leu Ile His Ser Leu Ser Ser Leu Pro Ser
405 410 415
cat gtt ccc aaa gcc tgc ctt ttg tat ttt ggt atg ttt cca tgt gat 1296
His Val Pro Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp
420 425 430
cat ccc ata aag agg aag agc ctg atg agg cga tgg tta gca gag gga 1344
His Pro Ile Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly
435 440 445
ttt gta caa aca cag cct tca tct agt gaa aac ttc aac acc ctc ata 1392
Phe Val Gln Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu Ile
450 455 460
gac cgg aat att att gag ccc atc ggc ata tgt aac gat gat cag gta 1440
Asp Arg Asn Ile Ile Glu Pro Ile Gly Ile Cys Asn Asp Asp Gln Val
465 470 475 480
aag aca tgc aaa aca tat ggc atg atg cac gag ttc att ttg tta atg 1488
Lys Thr Cys Lys Thr Tyr Gly Met Met His Glu Phe Ile Leu Leu Met
485 490 495
tcc acc tcc cat gac ttc att acc ctg ctt tgt aat aat aaa gtt gaa 1536
Ser Thr Ser His Asp Phe Ile Thr Leu Leu Cys Asn Asn Lys Val Glu
500 505 510
cac aaa tat gtg cgt cgg ctt tct ctc cat cat cat agt gct aca agt 1584
His Lys Tyr Val Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser
515 520 525
ggc agt ttt tcg gtc atc gac tta tct ctt gtt aga tct ctg atg gtt 1632
Gly Ser Phe Ser Val Ile Asp Leu Ser Leu Val Arg Ser Leu Met Val
530 535 540
ttt ggg gag gct ggc aaa act att ttg agt ttc cga aag tac gag cta 1680
Phe Gly Glu Ala Gly Lys Thr Ile Leu Ser Phe Arg Lys Tyr Glu Leu
545 550 555 560
ttg aga gtc ttg gat ctt gaa caa tgt acc gac ttg gaa gat gat cac 1728
Leu Arg Val Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His
565 570 575
ctc aaa gac ata tgc aac ctt ttt ctt atg aaa tat cta agc ctc gga 1776
Leu Lys Asp Ile Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly
580 585 590
gaa act att aga agt ctt cca aag gag ata gaa aaa ctg aag ctc ttg 1824
Glu Thr Ile Arg Ser Leu Pro Lys Glu Ile Glu Lys Leu Lys Leu Leu
595 600 605
gag aca ctt gac ttg agg aga aca aag gtg aaa aca cta cct ata gag 1872
Glu Thr Leu Asp Leu Arg Arg Thr Lys Val Lys Thr Leu Pro Ile Glu
610 615 620
gtc ctc ctg ctc ccc tgt tta ctc cat ctg ttt ggg aag ttc caa ttt 1920
Val Leu Leu Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe
625 630 635 640
tct gat aaa atc aag ata aca agt gac atg cag aag ttt ttc tta act 1968
Ser Asp Lys Ile Lys Ile Thr Ser Asp Met Gln Lys Phe Phe Leu Thr
645 650 655
gga cag agt aac tta gag aca ctt tca gga ttt atc aca gat ggg tct 2016
Gly Gln Ser Asn Leu Glu Thr Leu Ser Gly Phe Ile Thr Asp Gly Ser
660 665 670
caa gga ttg cca cag atg atg aat tac atg aat tta aga aag ctt aag 2064
Gln Gly Leu Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys
675 680 685
ata tgg ttt gag agg agt aag aga agc acc aac ttc acc gat ctt gtg 2112
Ile Trp Phe Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Val
690 695 700
aat gct gtc caa aag ttc atc cat gat gac aaa gag agc aat gat cca 2160
Asn Ala Val Gln Lys Phe Ile His Asp Asp Lys Glu Ser Asn Asp Pro
705 710 715 720
cgt tct cta tca ctt cat ttc gat gac ggc act gaa aac atc ctg aac 2208
Arg Ser Leu Ser Leu His Phe Asp Asp Gly Thr Glu Asn Ile Leu Asn
725 730 735
tct ttg aag gct cct tgt tac ctt agg tca ttg aag tta aaa ggg aat 2256
Ser Leu Lys Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn
740 745 750
ttg ctg gaa ctt ccc cag ttt gtc ata tca atg cgg ggt ctc cgg gag 2304
Leu Leu Glu Leu Pro Gln Phe Val Ile Ser Met Arg Gly Leu Arg Glu
755 760 765
ata tgc ctt tca tca aca aaa ttg aca tcg ggc ctc ctt gca aca ctc 2352
Ilc Cys Leu Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu
770 775 780
gct aac ttg aaa ggc ttg cag cat ctc aag ctg att gca gat gtc ctt 2400
Ala Asn Leu Lys Gly Leu Gln His Leu Lys Leu Ile Ala Asp Val Leu
785 790 795 800
gaa gat ttt atc att gaa ggt cag gca ttc ctg ggg ctg cta cac cta 2448
Glu Asp Phe Ile Ile Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu
805 810 815
tgt ttt gtc cta gaa cgt gcc acc tta cca ata att gaa gga gga gct 2496
Cys Phe Val Leu Glu Arg Ala Thr Leu Pro Ile Ile Glu Gly Gly Ala
820 825 830
ttg ccg tac ctc atc tca ctt aag cta atc tgc aaa gat cta gtt ggc 2544
Leu Pro Tyr Leu Ile Ser Leu Lys Leu Ile Cys Lys Asp Leu Val Gly
835 840 845
ctc ggt gac atc aaa atc aac cgc ctc aaa tgt ctt aag gaa gtc agt 2592
Leu Gly Asp Ile Lys Ile Asn Arg Leu Lys Cys Leu Lys Glu Val Ser
850 855 860
cta gat cat aga gtc gct tcg gaa aca aga gaa atc tgg gaa aaa gct 2640
Leu Asp His Arg Val Ala Ser Glu Thr Arg Glu Ile Trp Glu Lys Ala
865 870 875 880
gcc gag aag cat cca aac cgg ccg aaa gta ttg ttg gtc aac tca tct 2688
Ala Glu Lys His Pro Asn Arg Pro Lys Val Leu Leu Val Asn Ser Ser
885 890 895
gat gaa agc gaa att aag gct gta gac tgt tct gtt gct tca aga cca 2736
Asp Glu Ser Glu Ile Lys Ala Val Asp Cys Ser Val Ala Ser Arg Pro
900 905 910
get gtg agt gag gct aat gga act tct ccc atg tca gag gtt gat gta 2784
Ala Val Ser Glu Ala Ash Gly Thr Ser Pro Met Ser Glu Val Asp Val
915 920 925
cga gag gat gac att cag atg ata ctt aac cag ggg ctc tct gcc gct 2832
Arg Glu Asp Asp Ile Gln Met Ile Leu Asn Gln Gly Leu Ser Ala Ala
930 935 940
gct gag aaa cag atg aat tgt gca gtt cag cca agt tca aaa gct gaa 2880
Ala Glu Lys Gln Met Asn Cys Ala Val Gln Pro Ser Ser Lys Ala Glu
945 950 955 960
ctg aac tct gat ttc aat aat att agt ttc cca gag gtt gcg ctt ggt 2928
Leu Asn Ser Asp Phe Asn Asn Ile Ser Phe Pro Glu Val Ala Leu Gly
965 970 975
tta acc gag ctg tga 2943
Leu Thr Glu Leu *
980
<210>3
<211>980
<212>PRT
<213>玉蜀黍(Zea mays)
<220>
<221>DOMAIN
<222>(157)...(404)
<223>显示与核苷酸结合位点(NBS)结构域同源性的区域
<220>
<221>DOMAIN
<222>(528)...(846)
<223>显示与富亮氨酸重复(LRR)结构域宽松同源性的区域
<400>3
Met Glu Ala Ala Leu Leu Ser Gly Phe Ile Lys Thr Ile Leu Pro Arg
1 5 10 15
Leu Phe Ser Leu Val Gln Gly Arg Tyr Lys Leu His Lys Gly Leu Lys
20 25 30
Ser Asp Ile Lys Ser Leu Glu Lys Glu Leu His Met Ile Ala Val Thr
35 40 45
Ile Asp Glu Gln Ile Ser Leu Gly Arg Lys Asp Gln Gly Ala Val Leu
50 55 60
Ser Leu Ser Ile Asp Glu Leu His Glu Leu Ala His Gln Ile Glu Asp
65 70 75 80
Ser Ile Asp Arg Phe Leu Tyr His Val Thr Arg Glu Gln Gln Ala Ser
85 90 95
Phe Phe Arg Arg Thr Val Arg Ser Pro Lys Thr Leu Leu Ser Arg Gln
100 105 110
Arg Leu Ala Ala Glu Val Gln Phe Leu Lys Lys Ile Pro Glu Glu Ala
115 120 125
His Gln Arg Glu Lys Arg Tyr Arg Val Phe Ala Gly Leu Ser Ser Ser
130 135 140
Thr Arg His Thr Glu Ser Ser Ser Cys Ser Ser Val Ser Asp Pro His
145 150 155 160
Thr Leu Lys Ala Asp Val Val Gly Ile Asp Gly Pro Arg Asp Glu Leu
165 170 175
Val Gln Gln Leu Thr Glu Glu Ala Glu Gly Leu Thr Lys Gln Leu Lys
180 185 190
Val Ile Ser Ile Val Gly Ile His Gly Ser Gly Lys Thr Val Leu Ala
195 200 205
Arg Glu Val Tyr Glu Ser Asp Val Gly Arg Gln Phe Ser Leu Arg Ala
210 215 220
Trp Val Ser Ala Thr Asp Arg Gly Pro Arg Glu Val Leu Met Glu Ile
225 230 235 240
Leu Arg Asn Phe Gly Arg Pro Val Val Asp Ser Ser Ser Ile Asp Gln
245 250 255
Leu Thr Val Asp Leu Arg Lys His Leu Gly Glu Lys Arg Tyr Phe Ile
260 265 270
Val Ile Asp Gly Met Gln Thr Asp Gln Trp Ser Thr Ile Glu Thr Ala
275 280 285
Phe Pro Glu Asn Asn Val Val Ser Ser Arg Val Ile Val Thr Thr Thr
290 295 300
Ile Arg Ser Val Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Val His
305 310 315 320
Lys Met Lys Arg Leu Ser Asp Glu His Ser Glu Gln Leu Phe Ile Lys
325 330 335
Lys Ala Cys Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys
340 345 350
Glu Val Leu Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Val Thr Met
355 360 365
Gly Gln Phe Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu
370 375 380
Asn Val Cys Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu
385 390 395 400
Glu Arg Met Arg Arg Val Leu Ile His Ser Leu Ser Ser Leu Pro Ser
405 410 415
His Val Pro Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp
420 425 430
His Pro Ile Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly
435 440 445
Phe Val Gln Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu Ile
450 455 460
Asp Arg Asn Ile Ile Glu Pro Ile Gly Ile Cys Asn Asp Asp Gln Val
465 470 475 480
Lys Thr Cys Lys Thr Tyr Gly Met Met His Glu Phe Ile Leu Leu Met
485 490 495
Ser Thr Ser His Asp Phe Ile Thr Leu Leu Cys Asn Asn Lys Val Glu
500 505 510
His Lys Tyr Val Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser
515 520 525
Gly Ser Phe Ser Val Ile Asp Leu Ser Leu Val Arg Ser Leu Met Val
530 535 540
Phe Gly Glu Ala Gly Lys Thr Ile Leu Ser Phe Arg Lys Tyr Glu Leu
545 550 555 560
Leu Arg Val Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His
565 570 575
Leu Lys Asp Ile Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly
580 585 590
Glu Thr Ile Arg Ser Leu Pro Lys Glu Ile Glu Lys Leu Lys Leu Leu
595 600 605
Glu Thr Leu Asp Leu Arg Arg Thr Lys Val Lys Thr Leu Pro Ile Glu
610 615 620
Val Leu Leu Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe
625 630 635 640
Ser Asp Lys Ile Lys Ile Thr Ser Asp Met Gln Lys Phe Phe Leu Thr
645 650 655
Gly Gln Ser Asn Leu Glu Thr Leu Ser Gly Phe Ile Thr Asp Gly Ser
660 665 670
Gln Gly Leu Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys
675 680 685
Ile Trp Phe Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Val
690 695 700
Asn Ala Val Gln Lys Phe Ile His Asp Asp Lys Glu Ser Asn Asp Pro
705 710 715 720
Arg Ser Leu Ser Leu His Phe Asp Asp Gly Thr Glu Asn Ile Leu Asn
725 730 735
Ser Leu Lys Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn
740 745 750
Leu Leu Glu Leu Pro Gln Phe Val Ile Ser Met Arg Gly Leu Arg Glu
755 760 765
Ile Cys Leu Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu
770 775 780
Ala Asn Leu Lys Gly Leu Gln His Leu Lys Leu Ile Ala Asp Val Leu
785 790 795 800
Glu Asp Phe Ile Ile Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu
805 810 815
Cys Phe Val Leu Glu Arg Ala Thr Leu Pro Ile Ile Glu Gly Gly Ala
820 825 830
Leu Pro Tyr Leu Ile Ser Leu Lys Leu Ile Cys Lys Asp Leu Val Gly
835 840 845
Leu Gly Asp Ile Lys Ile Asn Arg Leu Lys Cys Leu Lys Glu Val Ser
850 855 860
Leu Asp His Arg Val Ala Ser Glu Thr Arg Glu Ile Trp Glu Lys Ala
865 870 875 880
Ala Glu Lys His Pro Asn Arg Pro Lys Val Leu Leu Val Asn Ser Ser
885 890 895
Asp Glu Ser Glu Ile Lys Ala Val Asp Cys Ser Val Ala Ser Arg Pro
900 905 910
Ala Val Ser Glu Ala Asn Gly Thr Ser Pro Met Ser Glu Val Asp Val
915 920 925
Arg Glu Asp Asp Ile Gln Met Ile Leu Asn Gln Gly Leu Ser Ala Ala
930 935 940
Ala Glu Lys Gln Met Asn Cys Ala Val Gln Pro Ser Ser Lys Ala Glu
945 950 955 960
Leu Asn Ser Asp Phe Asn Asn Ile Ser Phe Pro Glu Val Ala Leu Gly
965 970 975
Leu Thr Glu Leu
980
<210>4
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物a20Cforw4881
<400>4
cagggcctac ttggtttagt aata 24
<210>5
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物a20Crev4920
<400>5
gggtactaca ctagcctatt acta 24
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物a20fis19forw1110
<400>6
cggttacaag gtctacccaa tctg 24
<210>7
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物a20fis19rev1149
<400>7
gtcaaacaga tagccgcaga ttgg 24
<210>8
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物n07fis13forw51524
<400>8
tacaaaacta ctgcaacgcc tata 24
<210>9
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物n07fis13rev51563
<400>9
cctcacccca agtatatata ggcg 24
<210>10
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物n07Bforw10439/53434
<400>10
cattggacct cttccccact aaga 24
<210>11
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物n07Brev10478/53473
<400>11
tccttgagtc cagtgctctt agtg 24
<210>12
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物n07Aforw4333
<400>12
gaaactaggc gcgtcaggtt ttat 24
<210>13
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物n07Arev4372
<400>13
aaggcagcca ctgaaaataa aacc 24
<210>14
<211>954
<212>PRT
<213>稻(Oryza sativa)
<220>
<221>PEPTIDE
<222>(0)...(0)
<223>Accessi on No:NP_910480,稻NBS-LRR
<400>14
Met Glu Gly Ala Val Phe Ser Leu Thr Glu Gly Ala Val Arg Ser Leu
1 5 10 15
Leu Cys Lys Leu Gly Cys Leu Leu Thr Glu Asp Thr Trp Leu Val Gln
20 25 30
Gly Val His Gly Glu Ile Gln Tyr Ile Lys Asp Glu Leu Glu Cys Met
35 40 45
Asn Ala Phe Leu Arg Asn Leu Thr Ile Ser Gln Ile His Asp Asp Gln
50 55 60
Val Arg Ile Trp Met Lys Gln Val Arg Glu Ile Ala Tyr Asp Ser Glu
65 70 75 80
Asp Cys Ile Asp Glu Phe Ile His Asn Leu Gly Glu Ser Ser Glu Met
85 90 95
Gly Phe Phe Gly Gly Leu Ile Ser Met Leu Arg Lys Leu Ala Cys Arg
100 105 110
His Arg Ile Ala Leu Gln Leu Gln Glu Leu Lys Ala Arg Ala Gln Asp
115 120 125
Val Gly Asp Arg Arg Ser Arg Tyr Gly Val Glu Leu Ala Lys Ala Thr
130 135 140
His Glu Glu Ala His Pro Arg Leu Thr Arg His Ala Ser Leu His Ile
145 150 155 160
Asp Pro Gln Leu His Ala Leu Phe Ala Glu Glu Ala Gln Leu Val Gly
165 170 175
Ile Asp Glu Pro Arg Asn Glu Leu Val Ser Trp Leu Met Glu Glu Asp
180 185 190
Leu Arg Leu Arg Val Leu Ala Ile Val Gly Phe Gly Gly Leu Gly Lys
195 200 205
Thr Thr Leu Ala Arg Met Val Cys Gly Ser Pro Val Val Lys Ser Ala
210 215 220
Asp Phe Gln Cys Cys Pro Leu Phe Ile Ile Ser Gln Thr Phe Asn Ile
225 230 235 240
Arg Ala Leu Phe Gln His Met Val Arg Glu Leu Ile Gln Glu Pro His
245 250 255
Lys Ala Met Ala Ile Ala Gly Cys Lys His Gly Lcu Ile Thr Asp Asp
260 265 270
Tyr Leu Glu Gly Met Glu Arg Trp Glu Val Ala Ala Leu Thr Lys Asn
275 280 285
Leu Arg Arg Tyr Phe Gln Asp Lys Arg Tyr Ile Val Ile Leu Asp Asp
290 295 300
Ile Trp Thr Val Ser Ala Trp Glu Ser Ile Arg Cys Ala Leu Pro Asp
305 310 315 320
Asn Leu Lys Gly Ser Arg Ile Ile Val Thr Thr Arg Asn Ala Asp Val
325 330 335
Ala Asn Thr Cys Cys Ser Arg Pro Gln Asp Arg Ile Tyr Asn Ile Gln
340 345 350
Arg Leu Ser Glu Thr Thr Ser Arg Glu Leu Phe Phe Lys Lys Ile Phe
355 360 365
Gly Phe Ala Asp Asp Lys Ser Pro Thr Asp Glu Phe Glu Glu Val Ser
370 375 380
Asn Ser Val Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala Ile Val Asn
385 390 395 400
Ile Gly Ser Leu Leu Ala Ser Lys Thr Asn Arg Thr Lys Glu Glu Trp
405 410 415
Gln Lys Val Cys Asn Asn Leu Gly Ser Glu Leu Glu Asn Asn Pro Thr
420 425 430
Leu Glu Gly Val Lys Gln Val Leu Thr Leu Ser Tyr Asn Asp Leu Pro
435 440 445
Tyr His Leu Lys Ala Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asn
450 455 460
Tyr Val Ile Lys Arg Gly Pro Leu Val Arg Arg Trp Ile Ala Glu Gly
465 470 475 480
Phe Val Ser Gln Arg His Gly Gln Ser Met Glu Gln Leu Ala Glu Ser
485 490 495
Tyr Phe Asp Glu Phe Val Ala Arg Ser Ile Val Gln Pro Val Arg Thr
500 505 510
Asp Trp Thr Gly Lys Val Arg Ser Cys Arg Val His Asp Leu Met Leu
515 520 525
Asp Val Ile Val Ser Arg Ser Ile Glu Glu Asn Phe Ala Ser Phe Leu
530 535 540
Cys Asp Asn Gly Ser Thr Leu Ala Ser His Asp Lys Ile Arg Arg Leu
545 550 555 560
Ser Ile His Ser Ser Tyr Asn Ser Ser Gln Lys Thr Ser Ala Asn Val
565 570 575
Ser His Ala Arg Ser Phe Thr Met Ser Ala Ser Val Glu Glu Val Pro
580 585 590
Phe Phe Phe Pro Gln Leu Arg Leu Leu Arg Val Leu Asp Leu Gln Gly
595 600 605
Cys Ser Cys Leu Ser Asn Glu Thr Leu His Cys Met Cys Arg Phe Phe
610 615 620
Gln Leu Lys Tyr Leu Ser Leu Arg Asn Thr Asn Val Ser Lys Leu Pro
625 630 635 640
His Leu Leu Gly Asn Leu Lys His Leu Glu Thr Leu Asp Ile Arg Ala
645 650 655
Thr Leu Ile Lys Lys Leu Pro Ala Ser Ala Gly Asn Leu Ser Cys Leu
660 665 670
Lys His Leu Phe Ala Gly His Lys Val Gln Leu Thr Arg Thr Ala Ser
675 680 685
Val Lys Phe Leu Arg Gln Ser Ser Gly Lcu Glu Val Ala Thr Gly Val
690 695 700
Val Lys Asn Met Val Ala Leu Gln Ser Leu Val His Ile Val Val Lys
705 710 715 720
Asp Lys Ser Pro Val Leu Arg Glu Ile Gly Leu Leu Gln Asn Leu Thr
725 730 735
Lys Leu Asn Val Leu Leu Arg Gly Val Glu Glu Asn Trp Asn Ala Phe
740 745 750
Leu Glu Ser Leu Ser Lys Leu Pro Gly Pro Leu Arg Ser Leu Ser Ile
755 760 765
His Thr Leu Asp Glu Lys Glu His Ser Leu Ser Leu Asp Asn Leu Ala
770 775 780
Phe Val Glu Ser Pro Pro Leu Phe Ile Thr Lys Phe Ser Leu Ala Gly
785 790 795 800
Glu Leu Glu Arg Leu Pro Pro Trp Ile Pro Ser Leu Arg Asn Val Ser
805 810 815
Arg Phe Ala Leu Arg Arg Thr Glu Leu His Ala Asp Ala Ile Gly Val
820 825 830
Leu Gly Asp Leu Pro Asn Leu Leu Cys Leu Lys Leu Tyr His Lys Ser
835 840 845
Tyr Ala Asp Asn Cys Ile Val Phe Cys His Gly Lys Phe Val Lys Leu
850 855 860
Lys Leu Leu Ile Ile Asp Asn Leu Glu Arg Ile Glu Lys Met Gln Phe
865 870 875 880
Asp Ala Gly Ser Val Thr Asn Leu Glu Arg Leu Thr Leu Ser Phe Leu
885 890 895
Arg Glu Pro Lys Tyr Gly Ile Ser Gly Leu Glu Asn Leu Pro Lys Leu
900 905 910
Lys Glu Ile Glu Phe Phe Gly Asp Ile Ile Leu Ser Val Val Thr Lys
915 920 925
Val Ala Ser Cys Val Lys Ala His Pro Asn His Pro Arg Val Ile Gly
930 935 940
Asp Lys Trp Asn Ilc Val Thr Glu Tyr Ala
945 950
<210>15
<211>953
<212>PRT
<213>稻(Oryza sativa)
<220>
<221>PEPTIDE
<222>(0)...(0)
<223>Accession No.NP_910483稻NBS-LRR
<400>15
Met Glu Gly Ala Ile Phe Ser Val Ala Glu Gly Thr Val Arg Ser Leu
1 5 10 15
Leu Ser Lys Leu Ser Ser Leu Leu Ser Gln Glu Ser Trp Phe Val Arg
20 25 30
Gly Val His Gly Asp Ile Gln Tyr Ile Lys Asp Glu Leu Glu Ser Met
35 40 45
Asn Ala Phe Leu Arg Tyr Leu Thr Val Leu Glu Asp His Asp Thr Gln
50 55 60
Val Arg Ile Trp Met Lys Gln Val Arg Glu Ile Ala Tyr Asp Ala Glu
65 70 75 80
Asp Cys Ile Asp Gln Phe Thr His His Leu Gly Glu Ser Ser Gly Ile
85 90 95
Gly Phe Leu Tyr Arg Leu Ile Tyr Ile Leu Gly Lys Leu Cys Cys Arg
100 105 110
His Arg Ile Ala Met Gln Leu Gln Glu Leu Lys Ala Arg Ala Gln Asp
115 120 125
Val Ser Glu Arg Arg Ser Arg Tyr Glu Val Met Leu Pro Lys Thr Thr
130 135 140
Leu Gln Gly Ala Gly Pro Arg Leu Thr Arg His Ala Ser Arg His Leu
145 150 155 160
Asp Pro Gln Leu His Ala Leu Phe Thr Glu Glu Ala Gln Leu Val Gly
165 170 175
Leu Asp Glu Pro Arg Asp Lys Leu Val Arg Trp Val Met Glu Ala Asp
180 185 190
Pro Cys Arg Arg Val Leu Ala Ile Val Gly Phe Gly Gly Leu Gly Lys
195 200 205
Thr Thr Leu Ala Arg Met Val Cys Glu Asn Pro Met Val Lys Gly Ala
210 215 220
Asp Phe His Cys Cys Pro Leu Phe Ile Val Ser Gln Thr Phe Asn Ile
225 230 235 240
Arg Thr Leu Phe Gln Tyr Met Ile Arg Glu Leu Ile Gln Arg Pro Asn
245 250 255
Lys Ala Met Ala Val Ala Gly Gly Lys His Gly His Thr Met Asp Gly
260 265 270
Asn Met Asp Gly Met Glu Arg Trp Glu Val Ala Val Leu Ala Glu Lys
275 280 285
Val Arg Gln Tyr Leu Leu Asp Lys Tyr Ile Val Ile Phe Asp Asp Ile
290 295 300
Trp Thr Ile Ser Ala Trp Glu Ser Ile Arg Cys Ala Leu Pro Asp Asn
305 310 315 320
Lys Lys Gly Ser Arg Val Ile Ile Thr Thr Arg Asn Glu Asp Val Ala
325 330 335
Asn Thr Cys Cys Ser Gly Pro Gln Asp Gln Val Tyr Lys Met Gln Arg
340 345 350
Leu Ser Asp Ala Ala Ser Arg Glu Leu Phe Phe Lys Arg Ile Phe Gly
355 360 365
Ser Ala Asp Ile Ser Ser Asn Glu Glu Leu Asp Glu Val Ser Asn Ser
370 375 380
Ile Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala Ile Val Ser Ile Gly
385 390 395 400
Ser Leu Val Ala Ser Lys Thr Asn Arg Thr Lys Glu Glu Trp Gln Lys
405 410 415
Ile Cys Asp Asn Leu Gly Ser Glu Leu Glu Thr Asn Pro Thr Leu Glu
420 425 430
Val Ala Lys Gln Val Leu Thr Leu Ser Tyr Asn Asp Leu Pro Tyr His
435 440 445
Leu Lys Ala Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asn Tyr Val
450 455 460
Ile Arg Arg Gly Pro Leu Val Arg Arg Trp Ile Ala Glu Gly Phe Val
465 470 475 480
Asn Gln Arg His Gly Leu Ser Met Glu Glu Val Ala Glu Ser Tyr Phe
485 490 495
Asp Glu Phe Val Ala Arg Ser Ile Val Gln Pro Val Lys Ile Asp Trp
500 505 510
Ser Gly Lys Val Arg Thr Cys Arg Val His Asp Met Met Leu Glu Val
515 520 525
Ile Ile Ser Lys Ser Leu Glu Glu Asn Phe Ala Ser Phe Leu Cys Asp
530 535 540
Asn Gly His Pro Leu Val Cys His Asp Lys Ile Arg Arg Leu Ser Ile
545 550 555 560
His Asn Ser His Asn Ser Val Gln Arg Thr Arg Val Ser Val Ser His
565 570 575
Val Arg Ser Phe Thr Met Ser Ala Ser Val Glu Glu Val Pro Met Phe
580 585 590
Phe Pro Gln Met Arg Leu Leu Arg Val Leu Asp Leu Gln Gly Ser Ser
595 600 605
Cys Leu Asn Asn Ser Thr Leu Asn Tyr Ile Cys Lys Phe Tyr Gln Leu
610 615 620
Lys Tyr Leu Thr Leu Arg Lys Thr Asn Ile Gly Lys Leu Pro Arg Leu
625 630 635 640
Ile Gly Asn Leu Lys Tyr Leu Glu Thr Leu Asp Ile Arg Ala Thr Arg
645 650 655
Ile Lys Arg Leu Pro Ala Ser Ala Ser Asn Leu Ser Cys Leu Lys His
660 665 670
Leu Leu Val Gly His Lys Val Gln Leu Thr Arg Thr Thr Ser Val Lys
675 680 685
Cys Phe Arg Pro Asp Ser Gly Leu Glu Met Thr Ala Gly Val Val Lys
690 695 700
Asn Met Met Ala Leu Gln Ser Leu Ala His Ile Val Val Lys Glu Arg
705 710 715 720
Pro Ala Val Leu Ser Glu Ile Gly Gln Leu Gln Lys Leu Gln Lys Leu
725 730 735
Asn Val Leu Phe Arg Gly Val Glu Glu Asn Trp Asn Ala Phe Leu Gln
740 745 750
Ser Leu Val Lys Leu Thr Gly Ser Leu Arg Ser Leu Ser Ile His Ile
755 760 765
Leu Asp Glu Lys Glu His Ser Ser Ser Leu Glu Tyr Leu Ala Leu Ile
770 775 780
Ala Glu Ser Pro Pro Leu Phe Ile Arg Asn Phe Ser Leu Lys Gly Lys
785 790 795 800
Leu Gln Arg Leu Pro Pro Trp Ile Pro Ser Leu Arg Asn Val Ser Arg
805 810 815
Ile Thr Phe Arg Asp Thr Gly Leu His Ala Glu Ala Ile Gly Val Leu
820 825 830
Gly Asp Leu Pro Asn Leu Leu Cys Leu Lys Leu Tyr Gln Arg Ser Tyr
835 840 845
Ala Asp Asp His Ile Phe Phe Ala His Gly Asn Phe Leu Lys Leu Arg
850 855 860
Met Leu Val Ile Asp Asn Met Glu Asn Ile Arg Asn Val His Phe Glu
865 870 875 880
Lys Gly Ser Val Pro Asn Leu Glu Trp Leu Thr Ile Ala Phe Leu Gln
885 890 895
Glu Pro Lys Asp Gly Ile Thr Gly Leu Glu Asn Leu Leu Lys Leu Lys
900 905 910
Glu Ile Glu Phe Phe Gly Asp Ile Ile Leu Ser Met Val Thr Lys Val
915 920 925
Ala Ser Cys Met Lys Ala His Pro Asn Arg Pro Arg Val Ile Gly Asp
930 935 940
Lys Trp Asn Asn Val Thr Glu Tyr Ala
945 950
<210>16
<211>989
<212>PRT
<213>稻(0ryza sativa)
<220>
<221>PEPTIDE
<222>(0)...(0)
<223>Accession No:NP_910482稻NBS-LRR
<400>16
Met Glu Gly Ala Ile Val Ser Leu Thr Glu Gly Ala Val Arg Gly Leu
1 5 10 15
Leu Arg Lys Leu Ala Gly Val Leu Ala Gln Glu Ser Ser Pro Ala Gln
20 25 30
Arg Val His Gly Glu Val Gln Tyr Ile Lys Asp Glu Leu Glu Ser Met
35 40 45
Asn Ala Phe Leu Arg Ser Val Ser Thr Ser Pro Glu Asp Ala Ala Gly
50 55 60
His Asp Asp Gln Val Arg Val Trp Met Lys Gln Val Arg Glu Ile Ala
65 70 75 80
Tyr Asp Ala Glu Asp Cys Ile Asp Val Phe Val Arg Gly Arg Ser His
85 90 95
Pro Ala Ala Ala Ala Gly Asp Glu Gly Arg Leu Val Ala Ser Leu Arg
100 105 110
Arg Phe Val Arg Leu Leu Ala Gly Ala Leu Gly Val Gly Gly Gly Asp
115 120 125
Arg Ser Val Ala Ala Gln Leu Arg Glu Leu Lys Ala Arg Ala Arg Asp
130 135 140
Ala Gly Glu Arg Arg Thr Arg Tyr Gly Val Ser Leu Ala Ala Ala Ala
145 150 155 160
Val Arg Gly Gly Gly Gly Ser Ser Ser Ser Gly Arg Leu Asp Pro Arg
165 170 175
Leu His Ala Leu Phe Thr Glu Glu Ala Gln Leu Val Gly Ile Asp Gly
180 185 190
Pro Arg Glu Glu Leu Val Gly Trp Val Met Glu Glu Glu Pro Arg Leu
195 200 205
Arg Val Leu Ala Val Val Gly Phe Gly Gly Leu Gly Lys Thr Thr Leu
210 215 220
Ala Arg Met Val Cys Gly Ser Pro Arg Val Lys Gly Ala Ala Asp Phe
225 230 235 240
Gln Cys Ser Pro Pro Leu Val Val Val Ser Gln Thr Phe Ser Ile Thr
245 250 255
Ala Leu Phe Gln His Leu Leu Arg Glu Leu Ile Gln Arg Pro Arg Lys
260 265 270
Ala Met Ala Ala Val Ala Ala Ala Gly Gly Gly Gly Gly Asp Leu Val
275 280 285
Ala Tyr Asp Ala Leu Gln Gly Met Glu Arg Trp Glu Thr Ala Ala Leu
290 295 300
Ala Ser Lys Ala Glu Gly Ile Pro Ala Arg Gln Lys Phe Val His Ile
305 310 315 320
Cys Gly Thr Ile Thr Leu Tyr Arg Tyr Ile Val Ile Leu Asp Asp Ile
325 330 335
Trp Ser Ser Ser Ala Trp Glu Ser Ile Lys Cys Ala Phe Pro Asp Asn
340 345 350
Lys Lys Gly Ser Arg Ile Ile Val Thr Thr Arg Asn Glu Asp Val Ala
355 360 365
Asn Thr Cys Cys Cys Arg Pro Gln Asp Arg Ile Tyr Lys Ile Gln Arg
370 375 380
Leu Ser Asp Ala Ala Ser Arg Glu Leu Phe Phe Lys Arg Ile Phe Gly
385 390 395 400
Met Ala Asp Ala Gly Ala Pro Asp Asp Asp Glu Leu Lys Gln Val Ser
405 410 415
Asp Ser Ile Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala Ile Val Ser
420 425 430
Ile Gly Ser Leu Leu Ala Ser Lys Pro Asn Arg Ser Lys Glu Glu Trp
435 440 445
Gln Lys Val Cys Asp Asn Leu Gly Ser Glu Leu Glu Ser Asn Pro Thr
450 455 460
Leu Glu Gly Thr Lys Gln Val Leu Thr Leu Ser Tyr Asn Asp Leu Pro
465 470 475 480
Tyr His Leu Lys Ala Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asn
485 490 495
His Val Ile Lys Arg Gly Pro Leu Val Arg Met Trp Ile Ala Glu Gly
500 505 510
Phe Val Thr Gln Arg His Gly Leu Ser Met Glu Gln Val Gly Glu Arg
515 520 525
Tyr Phe Asp Glu Phe Val Ser Arg Ser Met Val His Leu Val Arg Ile
530 535 540
Asp Trp Ser Gly Lys Val Arg Ser Cys Lys Val His Asp Ile Met Leu
545 550 555 560
Glu Val Ile Val Ser Lys Ser Leu Glu Glu Asn Phe Ala Ser Phe Phe
565 570 575
Cys Asp Asn Gly Thr Glu Leu Val Ser His Asp Lys Ile Arg Arg Leu
580 585 590
Ser Ile Arg Ser Ser Ser Tyr Ser Ser Ala Gln Arg Thr Ser Asn Ser
595 600 605
Val Ala His Val Arg Thr Phe Arg Met Ser Pro Ser Ile Asp Asn Ile
610 615 620
Pro Phe Phe Phe Pro Gln Leu Arg Leu Leu Arg Val Leu Asp Met Gln
625 630 635 640
Gly Ser Arg Cys Met Ser Asn Lys Asn Leu Asp Cys Ile Cys Arg Phe
645 650 655
Phe Gln Leu Lys Tyr Leu Ser Leu Arg Asn Thr Ser Val Ser Ile Leu
660 665 670
Pro Arg Leu Ile Gly Asn Leu Asn His Leu Glu Thr Leu Asp Ile Arg
675 680 685
Glu Thr Leu Ile Lys Lys Leu Pro Ser Ser Ala Ala Asn Leu Thr Cys
690 695 700
Leu Lys His Leu Leu Ala Gly His Lys Glu Gln Leu Thr Arg Thr Ser
705 710 715 720
Ser Val Lys Phe Leu Arg Pro Ser Ser Gly Leu Lys Met Ser His Gly
725 730 735
Val Ile Arg Asn Met Ala Lys Leu Gln Ser Leu Val His Val Glu Ile
740 745 750
Lys Glu His Pro Ser Val Phe Gln Glu Ile Ala Leu Leu Gln Asn Leu
755 760 765
Arg Lys Leu Ser Val Leu Phe Tyr Gly Ile Glu Val Asn Trp Lys Pro
770 775 780
Phe Leu Glu Leu Leu Asn Met Leu Ser Gly Ser Val Arg Ser Leu Ser
785 790 795 800
Ile Asp Ile Phe Asp Ala Gln Gly Asn Ile Ser Ile Ser Ser Leu Glu
805 810 815
Met Leu Ser Ser Leu Val Ser Pro Pro Ile Phe Ile Thr Ser Phe Ser
820 825 830
Leu Thr Gly Lys Leu Gly Ser Leu Pro Pro Trp Val Ala Ser Leu Arg
835 840 845
Ser Val Ser Arg Leu Thr Leu Arg Arg Ser Gln Leu Arg Ala Asp Ala
850 855 860
Ile His Val Leu Gly Gly Leu Gln Asn Leu Leu Cys Leu Lys Leu Tyr
865 870 875 880
His Lys Ser Tyr Ala Asp Asp Arg Leu Val Phe Pro Gln Gly Gly Phe
885 890 895
Ala Arg Val Lys Leu Leu Ile Asp Asp Asn Leu Val Asn Leu Glu Lys
900 905 910
Leu His Phe Asn Glu Gly Ser Met Pro Asn Leu Glu Arg Leu Thr Leu
915 920 925
Ser Phe Leu Arg Glu Pro Lys Asp Gly Ile Ser Gly Leu Asn Asn Leu
930 935 940
Leu Lys Leu Lys Glu Val Glu Phe Phe Gly Asn Ile Val Ser Ser Val
945 950 955 960
Val Ser Lys Val Val Ser Cys Val Lys Asp His Pro Asn His Pro Arg
965 970 975
Val Val Gly Asp Lys Trp Asn Ile Val Thr Val Tyr Asn
980 985
<210>17
<211>998
<212>PRT
<213>稻(Oryza sativa)
<220>
<221>PEPTIDE
<222>(0)...(0)
<223>Accession No.NP_921091.1稻疾病抗性蛋白
<400>17
Met Glu Thr Ala Val Leu Ser Ala Val Leu Arg Thr Leu Gly Pro Lys
1 5 10 15
Leu Tyr Ala Phe Leu Arg Asp Gly His Asp Leu Leu Arg Arg Asp Leu
20 25 30
Glu Arg Asp Val His Tyr Ile Arg Asn Glu Leu Ala Met Ile Ala Ala
35 40 45
Ala Ile Glu Glu His Asp Arg Arg Pro Pro Pro Ala Ala Gly Asp Val
50 55 60
Arg Ser Ala Trp Ile Arg Gly Val Arg Asp Leu Ala Cys Asp Met Glu
65 70 75 80
Asp Cys Val Asp Arg Phe Val His Arg Ala Thr Gly His Gly Leu Ala
85 90 95
Ser Met Gly Ala Arg Ala Lys Phe Ala Ala Val Ile Gln Glu Leu Arg
100 105 110
Arg Lys Ser Glu Glu Leu Ser Arg Leu Arg Ala Ser Tyr Ala Ala Ala
115 120 125
Ala Gly Glu Pro Ser Cys Trp Val Ala Thr Gly Ser Ser Ala Leu Thr
130 135 140
Leu Pro Ala Ser Ser Ser Glu Ala His Thr Leu Ala Ser Asp Ile Val
145 150 155 160
Gly Met Asp Gly Pro Arg Asp Glu Ile Leu Glu Leu Ile Gly Glu Thr
165 170 175
Gln Gly Gln Leu Lys Val Ile Ser Ile Val Gly Phe Gly Gly Leu Gly
180 185 190
Lys Thr Leu Leu Ala Arg Gln Ile Tyr Glu Ser Asp Ala Val Ala Ala
195 200 205
Gln Phe His Pro Arg Ile Trp Val Arg Ala Ala Gly Lys Asn Ala Glu
210 215 220
Asp Val Leu Met Asp Ile Leu Gln Gln Leu Gly Met Pro Val His His
225 230 235 240
Cys His Ala Ser Asn Leu Val Val Asn Leu Arg Asn Cys Leu Glu Ser
245 250 255
Lys Arg Phe Phe Val Val Ile Asp Asp Met Gln Arg Glu Tyr Trp Asn
260 265 270
Ser Ser Phe Arg Asn Ala Phe Pro Ser Asp Thr Gly Leu Ser Ser Ile
275 280 285
Val Ile Val Thr Thr Ala Ile Gln Ser Ile Ala Asn Ala Cys Ser Ser
290 295 300
Arg Asn Ser His Val Tyr Val Met Arg Thr Leu Asn Glu Glu His Ser
305 310 315 320
Arg Gln Leu Phe Leu Lys Glu Ala Ser Trp Lys Asp Tyr Pro Pro Gly
325 330 335
Ser Glu Ala Ile Leu Lys Lys Cys Asp Gly Leu Pro Leu Ala Leu Val
340 345 350
Thr Thr Ala Gln Phe Leu Gln Ser Arg Cys Gln Gln Gln Pro Leu Gly
355 360 365
Cys Ala Lys Leu Cys Asp Asn Leu Gly Lys His Leu Val Thr Glu Asp
370 375 380
Thr Leu Ala Arg Met Lys Arg Val Leu Val His His Tyr Ser Ser Leu
385 390 395 400
Pro Gly His Val Ile Lys Ala Cys Leu Leu Tyr Leu Gly Ile Phe Pro
405 410 415
Ser Gly His Pro Val Arg Arg Lys Thr Leu Ile Arg Arg Trp Ser Ala
420 425 430
Glu Gly Phe Val Gly Ala Asp His His Arg Ser Ser Leu Asp Val Ala
435 440 445
Tle Asp Ser Phe Glu Glu Leu Val Asn Arg Ser Ile Ile Gln Pro Val
450 455 460
Asp Val Ser Ser Asn Thr Glu Val Lys Thr Cys Gln Thr His Gly Met
465 470 475 480
Met Leu Glu Phe Ile Leu His Lys Ser Ile Cys Asp Asn Phe Ile Thr
485 490 495
Phe Leu Tyr Gly Gln Ala Arg Leu Pro Asp Lys Ile Arg Cys Val Ser
500 505 510
Ile Gln Gln Asn Ser Gly Ser Lys Thr Arg Val Asp Ser Asp Ile Asp
515 520 525
Leu Ser Leu Val Arg Ser Leu Thr Ile Phe Gly Lys Ala His Lys Ser
530 535 540
Phe Leu Asn Phe Ser Arg Tyr Lys Leu Leu Arg Val Leu Asp Leu Glu
545 550 555 560
Glu Cys Asp Glu Leu Glu Asp Glu His Leu Lys Lys Ile Cys Lys Arg
565 570 575
Leu Leu Leu Lys Tyr Leu Ser Leu Gly Arg Gly Ile Thr Val Leu Pro
580 585 590
Lys Glu Ile Ala Lys Leu Lys Phe Leu Glu Thr Leu Asp Leu Arg Arg
595 600 605
Thr Val Ile Lys Phe Leu Pro Ile Gln Val Leu Glu Leu Pro Cys Leu
610 615 620
Ile His Leu Phe Gly Val Phe Lys Ile Gln Asp Ala Asp Gln Gln Met
625 630 635 640
Arg Lys Leu Lys Ser Phe Leu Thr Glu Lys Ser Lys Leu Glu Thr Leu
645 650 655
Ala Gly Phe Val Thr Asp Arg Cys Gln Thr Phe Pro Gln Leu Met Lys
660 665 670
His Met Thr Asn Leu Ala Lys Val Lys Ile Trp Cys Glu Asn Thr Ala
675 680 685
Asp Ala Ser Ser Ser Ser Asn Ser Asp Val His Leu Ser Glu Ala Ile
690 695 700
Gln Glu Phe Ile Gln Arg Gly Thr Asp Val Asn Asp Val Arg Ser Leu
705 710 715 720
Ser Leu Asp Val Gly Glu Cys Ser Gln Glu Phe Leu Asn Phe Ser Leu
725 730 735
Gly Asp Ser Cys Tyr Leu Ser Ser Leu Lys Leu Lys Gly Asn Lys Ile
740 745 750
Cys Arg Leu Pro Pro Phe Val Thr Ser Leu Ala Val Leu Thr Asp Leu
755 760 765
Cys Leu Ser Ser Ser Asp Arg Leu Ser Ser Asp Val Leu Ala Ala Leu
770 775 780
Ser Asn Val Arg Ala Leu Arg Tyr Leu Lys Leu Ile Ala Arg His Leu
785 790 795 800
Asp Arg Phe Val Ile Glu Arg Gly Asp Leu Gln Ser Leu Arg Arg Leu
805 810 815
His Ile Val Val Val Ser Met Thr Thr Met Ser Lys Gln Gln Pro Glu
820 825 830
Ile Gln Glu Gly Ala Leu Pro Asn Leu Glu Ser Phe His Leu Leu Cys
835 840 845
Lys Asp Leu Asp Gly Pro Cys Gly His Gly Gly Ile Arg Ile Asp Ser
850 855 860
Leu Gly Leu Gly Cys Leu Arg Glu Ile Val Leu Asp Asp Gly Val Arg
865 870 875 880
Glu Thr Ala Lys Glu Gln Trp Lys Asp Ala Ala Arg Arg His Pro Lys
885 890 895
Arg Pro Lys Val Val Phe Val Gly Ala Gly Asp Val Val Asp Arg Arg
900 905 910
Arg Val Gly Ala Ala Ala Ala Ala Ala Pro Ala Ala Gly Glu Ser Asn
915 920 925
Ser Ala Met Ala Pro Ala Ala Val Ala Ser Val Val Ala Ala Gly Asp
930 935 940
Val Lys Arg Pro Ala Arg Glu Glu Ser Asp Ile Ser Ala Ala Leu Ala
945 950 955 960
Ser Leu Pro Ala Lys Met Ala Arg Leu Leu Gly Ala Ala Ser Ile His
965 970 975
Gln Ser Ser Gly Thr Gln Gly Glu Leu Ser Cys Gly Gly Asn Gly Ala
980 985 990
Ser Gln Arg His Phe Ser
995
<210>18
<211>958
<212>PRT
<213>大麦(Hordeum vulgare)
<220>
<221>PEPTIDE
<222>(0)...(0)
<223>Accession No.AAG37354,大麦白粉病抗性蛋白
<400>18
Met Asp Ile Val Thr Gly Ala Ile Ser Asn Leu Ile Pro Lys Leu Gly
1 5 10 15
Glu Leu Leu Thr Glu Glu Phe Lys Leu His Lys Gly Val Lys Lys Asn
20 25 30
Ile Glu Asp Leu Gly Lys Glu Leu Glu Ser Met Asn Ala Ala Leu Ile
35 40 45
Lys Ile Gly Glu Val Pro Arg Glu Gln Leu Asp Ser Gln Asp Lys Leu
50 55 60
Trp Ala Asp Glu Val Arg Glu Leu Ser Tyr Val Ile Glu Asp Val Val
65 70 75 80
Asp Lys Phe Leu Val Gln Val Asp Gly Ile Gln Phe Asp Asp Asn Asn
85 90 95
Asn Lys Phe Lys Gly Phe Met Lys Arg Thr Thr Glu Leu Leu Lys Lys
100 105 110
Val Lys His Lys His Gly Ile Ala His Ala Ile Lys Asp Ile Gln Glu
115 120 125
Gln Leu Gln Lys Val Ala Asp Arg Arg Asp Arg Asn Lys Val Phe Val
130 135 140
Pro His Pro Thr Arg Thr Ile Ala Ile Asp Pro Cys Leu Arg Ala Leu
145 150 155 160
Tyr Ala Glu Ala Thr Glu Leu Val Gly Ile Tyr Gly Lys Arg Asp Gln
165 170 175
Asp Leu Met Arg Leu Leu Ser Met Glu Gly Asp Asp Ala Ser Asn Lys
180 185 190
Arg Leu Lys Lys Val Ser Ile Val Gly Phe Gly Gly Leu Gly Lys Thr
195 200 205
Thr Leu Ala Arg Ala Val Tyr Glu Lys Ile Lys Gly Asp Phe Asp Cys
210 215 220
Arg Ala Phe Val Pro Val Gly Gln Asn Pro His Met Lys Lys Val Leu
225 230 235 240
Arg Asp Ile Leu Ile Asp Leu Gly Asn Pro His Ser Asp Leu Ala Met
245 250 255
Leu Asp Ala Asn Gln Leu Ile Lys Lys Leu Arg Glu Phe Leu Glu Asn
260 265 270
Lys Arg Tyr Leu Val Ile Ile Asp Asp Ile Trp Asp Glu Lys Leu Trp
275 280 285
Glu Gly Ile Asn Phe Ala Phe Ser Asn Arg Asn Asn Leu Gly Ser Arg
290 295 300
Leu Ile Thr Thr Thr Arg Ile Val Ser Val Ser Asn Ser Cys Cys Ser
305 310 315 320
Ser His Gly Asp Ser Val Tyr Gln Met Glu Pro Leu Ser Val Asp Asp
325 330 335
Ser Arg Ile Leu Phe Trp Lys Arg Ile Phe Pro Asp Glu Asn Gly Cys
340 345 350
Leu Asn Glu Phe Glu Gln Val Ser Arg Asp Ile Leu Lys Lys Cys Gly
355 360 365
Gly Val Pro Leu Ala Ile Ile Thr Ile Ala Ser Ala Leu Ala Gly Asp
370 375 380
Gln Lys Met Lys Pro Lys Cys Glu Trp Asp Ile Leu Leu Gln Ser Leu
385 390 395 400
Gly Ser Gly Leu Thr Glu Asp Asn Ser Leu Glu Glu Met Arg Arg Ile
405 410 415
Leu Ser Phe Ser Tyr Ser Asn Leu Pro Ser His Leu Lys Thr Cys Leu
420 425 430
Leu Tyr Leu Cys Ile Tyr Pro Glu Asp Ser Lys Ile His Arg Asp Glu
435 440 445
Leu Ile Trp Lys Trp Val Ala Glu Gly Phe Val His His Glu Asn Gln
450 455 460
Gly Asn Ser Leu Tyr Leu Leu Gly Leu Asn Tyr Phe Asn Gln Leu Ile
465 470 475 480
Asn Arg Ser Met Ile Gln Pro Ile Tyr Gly Phe Asn Asp Glu Val Tyr
485 490 495
Val Cys Arg Val His Asp Met Val Leu Asp Leu Ile Cys Asn Leu Ser
500 505 510
Arg Glu Ala Lys Phe Val Asn Leu Leu Asp Gly Ser Gly Asn Ser Met
515 520 525
Ser Ser Gln Gly Asn Cys Arg Arg Leu Ser Leu Gln Lys Arg Asn Glu
530 535 540
Asp His Gln Ala Lys Pro Ile Thr Asp Ile Lys Ser Met Ser Arg Val
545 550 555 560
Arg Ser Ile Thr Ile Phe Pro Pro Ala Ile Glu Val Met Pro Ser Leu
565 570 575
Ser Arg Phe Asp Val Leu Arg Val Leu Asp Leu Ser Arg Cys Asn Leu
580 585 590
Gly Glu Asn Ser Ser Leu Gln Leu Asn Leu Lys Asp Val Gly His Leu
595 600 605
Thr His Leu Arg Tyr Leu Gly Leu Glu Gly Thr Asn Ile Ser Lys Leu
610 615 620
Pro Ala Glu Ile Gly Lys Leu Gln Phe Leu Glu Val Leu Asp Leu Gly
625 630 635 640
Asn Asn His Asn Leu Lys Glu Leu Pro Ser Thr Val Cys Asn Phe Arg
645 650 655
Arg Leu Ile Tyr Leu Asn Leu Phe Gly Cys Pro Val Val Pro Pro Val
660 665 670
Gly Val Leu Gln Asn Leu Thr Ser Ile Glu Val Leu Arg Gly Ile Leu
675 680 685
Val Ser Val Asn Ile Ile Ala Gln Glu Leu Gly Asn Leu Glu Arg Leu
690 695 700
Arg Val Leu Asp Ile Cys Phe Arg Asp Gly Ser Leu Asp Leu Tyr Lys
705 710 715 720
Asp Phe Val Lys Ser Leu Cys Asn Leu His His Ile Glu Ser Leu Arg
725 730 735
Ile Glu Cys Asn Ser Arg Glu Thr Ser Ser Phe Glu Leu Val Asp Leu
740 745 750
Leu Gly Glu Arg Trp Val Pro Pro Val His Phe Arg Glu Phe Val Ser
755 760 765
Ser Met Pro Ser Gln Leu Ser Ala Leu Arg Gly Trp Ile Lys Arg Asp
770 775 780
Pro Ser His Leu Ser Ash Leu Ser Glu Leu Ile Leu Ser Ser Val Lys
785 790 795 800
Asp Val Gln Gln Asp Asp Val Glu Ile Ile Gly Gly Leu Leu Cys Leu
805 810 815
Arg Arg Leu Phe Ile Ile Thr Ser Thr Asp Gln Thr Gln Arg Leu Leu
820 825 830
Val Ile Arg Ala Asp Gly Phe Arg Cys Thr Val Asp Phe Arg Leu Asp
835 840 845
Cys Gly Ser Ala Thr Gln Ile Leu Phe Glu Pro Gly Ala Leu Pro Arg
850 855 860
Ala Val Arg Val Trp Phe Ser Leu Gly Val Arg Val Thr Lys Glu Asp
865 870 875 880
Gly Asn Arg Gly Phe Asp Leu Gly Leu Gln Gly Asn Leu Phe Ser Leu
885 890 895
Arg Glu Phe Val Ser Val Tyr Met Tyr Cys Gly Gly Ala Arg Val Gly
900 905 910
Glu Ala Lys Glu Ala Glu Ala Ala Val Arg Arg Ala Leu Glu Ala His
915 920 925
Pro Ser His Pro Arg Ile Tyr Ile Gln Met Arg Pro His Ile Ala Lys
930 935 940
Gly Ala His Asp Asp Asp Leu Cys Glu Asp Glu Glu Glu Asn
945 950 955
<210>19
<211>17
<212>DNA
<213>人工序列
<220>
<223>MPSS特征序列标志
<400>19
gatctcataa ctaggat 17
<210>20
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物KEB131
<400>20
tgatccttga ttgtccatgg 20
<210>21
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物KEB138
<400>21
ccgttgcttg catatatgct 20
<210>22
<211>1684
<212>DNA
<213>玉蜀黍(Zea mays)
<220>
<221>启动子
<222>(0)...(0)
<223>Rcg1启动子区域
<400>22
actgtcgggg accataatta ggggtaccct caagacgcct aattctcagc tggtaacccc 60
catcagcata aagctgcaaa ggcctgatgg gcacgattaa gtcagggatc agtccacacg 120
agtgactcga tcgcgcttca cccgagccta gcctcggccg aaggcagccg acctcgagag 180
acttccgtct cgcccgaggc cccccttttt atggcggaca catcaccggc ttgcccaagg 240
ccttggcttc gctcagaagc aaccttgact aaatcaccac accgactgac caaattgcag 300
gggcatttaa cgcaaaggtg gcctgacacc tctatcctga cacgcgcccc cggcagagcc 360
gaggtgaccg ccgtcactcc accgctccac tggccagtct gacagaagga cagcgccgcc 420
tgcgccactc cgactgcagt gccactcgac agagtgagtc tgacaggcaa ctaggccttg 480
ccgaaggcgc cacggcgaac tccgctccgc ccgaccccag ggctcggact cgggctaaga 540
cccggaagac ggcgaactcc gctccgcccg accccagggc tcggactcgg gctaagaccc 600
ggaagacggc gaactccgct ccgcccgacc ccagggctcg gactcgggct aagacccgga 660
agacggcgaa ctccgctccg cccgacccca gggctcggac tcgggctaag acccggaaga 720
cggcgaactc cgctccgccc gaccccaggg ctcggactcg ggctaagacc cggaagacgg 780
cgaactccgc tccgcccgac cccagggctc agactcaggc taagacccgg aagacgacga 840
aactccgcct cgcccgaccc cagggctcgg actccgccct ggcctcggcc ggacgacttc 900
cgcctcgccc gaccccctgg ctcgggctcg gccacagcaa ctgaaggcaa gactcaacct 960
cggcttcgga ggaaacccca cgtcgccctg cctagagcac agaccgccac gtcaacagga 1020
aacgtcatca tcaccctacc ccgaatcgac tcgggtcacg gagaacaaga ccggcgtctc 1080
gtccggccag ctccgccaga ggggcaatga tggcgctcca cgagctctat gacgacggcg 1140
gcccccagct ctcttacggc agcaggacaa cgtcagcagg gactcgaccg ctccaacagc 1200
tgtccctcca tcaggctccg ccgcaccacc gatagccacg acatcacgcc agcaggatgc 1260
ccagatctct ccggctgcca catcggcatg tacctagggc actagctctc cctccgctag 1320
acacgtagca ctctgctaca tccccattgt acacctgggt cctctcctta cgactataaa 1380
aggaaggacc agggtcttct cagagaaggt tggccgcgcg ggaccgagga cgggacaggc 1440
gctctcttgg ggccgctcgc ttccctcacc cgcgtggacg cttgtaaccc ccctactgca 1500
agcgcacctg acctgggcgc gggacgaaca cgaaggccgc gggacttcca cctctctcac 1560
gctcggctcc ggccgcctcg cctctccccc ctccgcgctc gcccacgcgc tcgacccatc 1620
tgggctgggg cacgcagcac actcactcgt cggcttaggg accccctgtc tcgaaacgcc 1680
gaca 1684
<210>23
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP8反向
<400>23
acatgggtcc aaagatcgac 20
<210>24
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP8正向
<400>24
catggaagcc ccacaataac 20
<210>25
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP27反向
<400>25
gcatgcccca tctggtatag 20
<210>26
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP27正向
<400>26
agccctattt cctgctcctg 20
<210>27
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP33反向
<400>27
gcattcacat gttcctcacc 20
<210>28
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP33正向
<400>28
ctgtcgttcg gttttgcttc 20
<210>29
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP41反向
<400>29
ctgtaaggca cccgatgttt 20
<210>30
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP41正向
<400>30
tgtgttcgca tcaaaggtgt 20
<210>31
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP56反向
<400>31
tgtccagggt tacagaaaac g 21
<210>32
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP56正向
<400>32
ggtctgggaa tgctaaagag g 21
<210>33
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP95正向
<400>33
atttcgacgg agggttcttc 20
<210>34
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP95反向
<400>34
gcagcaggag gagctcatag 20
<210>35
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP110正向
<400>35
atggaggctg ccctgctgag 20
<210>36
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP110反向
<400>36
cgtatacctc tctggcaagg acgg 24
<210>37
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP111正向
<400>37
ttcctgttcg tctgtatctg atccg 25
<210>38
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP111反向
<400>38
tttgattccg gtcgagtata acctg 25
<210>39
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP112正向
<400>39
gaaactgcct tcccagaaaa caatg 25
<210>40
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP112反向
<400>40
caagatcggt gaagttggtg cttc 24
<210>41
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP113F正向
<400>41
atcacagatg ggtctcaagg attgc 25
<210>42
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物Alex1R反向
<400>42
ttccaagcaa ttcacagctc 20
<210>43
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1612正向
<400>43
aggtccaggt tacagagcaa gaga 24
<210>44
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1612反向
<400>44
gctagtaggt gcatggtggt ttct 24
<210>45
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc2041正向
<400>45
ctacacaagc atagaggcct ggag 24
<210>46
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc2041反向
<400>46
cagtacgaga cgatggagga cat 23
<210>47
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物cdo127正向
<400>47
tgctgttgtt actcgggttg 20
<210>48
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物cdo127反向
<400>48
ctctgcctca gcacaaattc 20
<210>49
<211>26
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物phi093正向
<400>49
agtgcgtcag cttcatcgcc tacaag 26
<210>50
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物phi093反向
<400>50
aggccatgca tgcttgcaac aatggataca 30
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物cdo365正向
<400>51
cttccagagg caaagcgtag 20
<210>52
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物cdo365反向
<400>52
tgtcacccat gatccagttg 20
<210>53
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物csu166正向
<400>53
tattgtgcac gtcaccttgg 20
<210>54
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物csu166反向
<400>54
gggcagactt actgctggag 20
<210>55
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc2285正向
<400>55
atctgcctcc ttttccttgg 20
<210>56
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc2285反向
<400>56
aagtagctgg gcttggaggg 20
<210>57
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11455正向
<400>57
acgaagcaat ttcaccttcc 20
<210>58
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11455反向
<400>58
tgtggaacta accctcagca tag 23
<210>59
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA6064正向
<400>59
cgagaaccgg agaagaagg 19
<210>60
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA6064反向
<400>60
ttgggctgct gtattttgtg 20
<210>61
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA15842正向
<400>61
gacgcagctg tgaagttgg 19
<210>62
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA15842反向
<400>62
caccggaata ccttgaccac 20
<210>63
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1086正向
<400>63
catgaaagtt ttcctgtgca gatt 24
<210>64
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1086反向
<400>64
gggcaacttt agaggtcgat ttatt 25
<210>65
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1466正向
<400>65
gatccactag ggtttcgggg t 21
<210>66
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1466反向
<400>66
cgaatagtgg tctcgcgtct atct 24
<210>67
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1418正向
<400>67
gagccaagag ccagagcaaa g 21
<210>68
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1418反向
<400>68
tcacacacac actacactcg caat 24
<210>69
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物BNLG2162正向
<400>69
caccggcatt cgatatcttt 20
<210>70
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物BNLG2162反向
<400>70
gtctgctgct agtggtggtg 20
<210>71
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物csu166正向
<400>71
aaatatcggc tttggtcacg 20
<210>72
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物csu166
<400>72
tcgtccttcc tcaattcgac 20
<210>73
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1051正向
<400>73
aatgatcgaa atgccattat ttgt 24
<210>74
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1051反向
<400>74
ctgatctgac taaggccatc aaac 24
<210>75
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc2187正向
<400>75
acccaacaag tcttaatcgg gttt 24
<210>76
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc2187反向
<400>76
gtccacccta cctctcaaca aaca 24
<210>77
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1371正向
<400>77
catgtgaatg gaagtgtccc ttt 23
<210>78
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1371反向
<400>78
gcatcctttt cgtttcaaat atgc 24
<210>79
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1856正向
<400>79
agatctgttt tgctttgctc tgct 24
<210>80
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物umc1856反向
<400>80
catgccttta ttctcacaca aacg 24
<210>81
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1215外部嵌套正向引物
<400>81
agcccaattc tgtagatcca a 21
<210>82
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1215外部嵌套反向引物
<400>82
tgcatgcacc ggatccttc 19
<210>83
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1215内部嵌套正向引物
<400>83
agcagcagac gatgcaaaga 20
<210>84
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1215内部嵌套反向引物
<400>84
aggctggcgg tggacttga 19
<210>85
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1216外部嵌套正向引物
<400>85
ccggcctacg gcaacaagaa 20
<210>86
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1216外部嵌套反向引物
<400>86
agggtacggt gacccgaag 19
<210>87
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1216内部嵌套正向引物
<400>87
ttcgagacgc tgtcgtacct 20
<210>88
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1216内部嵌套反向引物
<400>88
acgacgcatg gcactagcta 20
<210>89
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA3434外部嵌套正向引物
<400>89
tgtaccgcga gaactcca 18
<210>90
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA3434外部嵌套反向引物
<400>90
ttgcattcac atgttcctca c 21
<210>91
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA3434内部嵌套正向引物
<400>91
ctactacgac ggccgcta 18
<210>92
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA3434内部嵌套反向引物
<400>92
ttgcagtagt tttgtagcag g 21
<210>93
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA2591外部嵌套正向引物
<400>93
agtaaataac agcattgacc tc 22
<210>94
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA2591外部嵌套反向引物
<400>94
tccaacggcg gtcactcc 18
<210>95
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA2591内部嵌套正向引物
<400>95
ctatataaca gggccctgga a 21
<210>96
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA2591内部嵌套反向引物
<400>96
cacaaagccc acaagctaag 20
<210>97
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11123外部嵌套正向引物
<400>97
accacaatct gaagcaagta g 21
<210>98
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11123外部嵌套反向引物
<400>98
cacagaaaca tctggtgctg 20
<210>99
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11123内部嵌套正向引物
<400>99
aaagaccaag aaatgcagtc c 21
<210>100
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11123内部嵌套反向引物
<400>100
agacatcacg taacagtttc c 21
<210>101
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA15842外部嵌套正向引物
<400>101
ctcgattggc atacgcgata 20
<210>102
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA15842外部嵌套反向引物
<400>102
ttccttctcc acgcagttca 20
<210>103
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA15842内部嵌套正向引物
<400>103
agaaggtatt tgccatggct ta 22
<210>104
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA15842内部嵌套反向引物
<400>104
gtttcacttg ctgaaggcag tc 22
<210>105
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11455外部嵌套正向引物
<400>105
gaccgatgaa ggcaattgtg a 21
<210>106
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11455外部嵌套反向引物
<400>106
accaaatagt cctagataat gg 22
<210>107
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11455内部嵌套正向引物
<400>107
ttcaaccttc tgactgacac at 22
<210>108
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11455内部嵌套反向引物
<400>108
taaacatagt cataaaaatt ac 22
<210>109
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA6064外部嵌套正向引物
<400>109
tcgaatgtat tttttaatgc gg 22
<210>110
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA6064外部嵌套反向引物
<400>110
atccacaatg gcacttgggt 20
<210>111
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA6064内部嵌套正向引物
<400>111
cagctatttt tgtcttcttc ct 22
<210>112
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA6064内部嵌套反向引物
<400>112
ggtcagattc caattcggac 20
<210>113
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11394外部嵌套正向引物
<400>113
tcgtcctaac agcctgtgtt 20
<210>114
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11394外部嵌套反向引物
<400>114
gtccggatca aatggatcgt 20
<210>115
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11394内部嵌套正向引物
<400>115
aacagcctgt gttgaataag gt 22
<210>116
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA11394内部嵌套反向引物
<400>116
cgtgttccgt cgagggagt 19
<210>117
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA8761外部嵌套正向引物
<400>117
ttctttgatt ctactcttga gc 22
<210>118
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA8761外部嵌套反向引物
<400>118
cttcatggac gcctgagatt 20
<210>119
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA8761内部嵌套正向引物
<400>119
tagagctttc tgaactgata gc 22
<210>120
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA8761内部嵌套反向引物
<400>120
ttggcattta gcttctctcc a 21
<210>121
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1851外部嵌套正向引物
<400>121
atatattgca ccacttaaag cc 22
<210>122
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1851外部嵌套反向引物
<400>122
gggtgttatc acttgttcta ta 22
<210>123
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1851内部嵌套正向引物
<400>123
tggagtcctt gaccatttgc 20
<210>124
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1851内部嵌套反向引物
<400>124
tatatgcact tctagcgagt at 22
<210>125
<211>32
<212>DNA
<213>人工序列
<220>
<223>从来自增变基因元件序列的末端反向重复序列(TIR)设计的简并寡核苷酸共有引物
<400>125
agagaagcca acgccawcgc ctcyatttcg tc 32
<210>126
<211>18
<212>DNA
<213>人工序列
<220>
<223>为了对PCR产物进行测序的寡核苷酸引物,其与MZA内部引物组合连接使用
<400>126
tgtaaaacga cggccagt 18
<210>127
<211>19
<212>DNA
<213>人工序列
<220>
<223>为了对PCR产物进行测序的寡核苷酸引物,其与MZA内部引物组合连接使用
<400>127
ggaaacagct atgaccatg 19
<210>128
<211>1698
<212>DNA
<213>人工序列
<220>
<223>Rcg1启动子,在5’末端添加了14bp的克隆寡核苷酸序列
<400>128
gaggctcggg ggctactgtc ggggaccata attaggggta ccctcaagac gcctaattct 60
cagctggtaa cccccatcag cataaagctg caaaggcctg atgggcacga ttaagtcagg 120
gatcagtcca cacgagtgac tcgatcgcgc ttcacccgag cctagcctcg gccgaaggca 180
gccgacctcg agagacttcc gtctcgcccg aggcccccct ttttatggcg gacacatcac 240
cggcttgccc aaggccttgg cttcgctcag aagcaacctt gactaaatca ccacaccgac 300
tgaccaaatt gcaggggcat ttaacgcaaa ggtggcctga cacctctatc ctgacacgcg 360
cccccggcag agccgaggtg accgccgtca ctccaccgct ccactggcca gtctgacaga 420
aggacagcgc cgcctgcgcc actccgactg cagtgccact cgacagagtg agtctgacag 480
gcaactaggc cttgccgaag gcgccacggc gaactccgct ccgcccgacc ccagggctcg 540
gactcgggct aagacccgga agacggcgaa ctccgctccg cccgacccca gggctcggac 600
tcgggctaag acccggaaga cggcgaactc cgctccgccc gaccccaggg ctcggactcg 660
ggctaagacc cggaagacgg cgaactccgc tccgcccgac cccagggctc ggactcgggc 720
taagacccgg aagacggcga actccgctcc gcccgacccc agggctcgga ctcgggctaa 780
gacccggaag acggcgaact ccgctccgcc cgaccccagg gctcagactc aggctaagac 840
ccggaagacg acgaaactcc gcctcgcccg accccagggc tcggactccg ccctggcctc 900
ggccggacga cttccgcctc gcccgacccc ctggctcggg ctcggccaca gcaactgaag 960
gcaagactca acctcggctt cggaggaaac cccacgtcgc cctgcctaga gcacagaccg 1020
ccacgtcaac aggaaacgtc atcatcaccc taccccgaat cgactcgggt cacggagaac 1080
aagaccggcg tctcgtccgg ccagctccgc cagaggggca atgatggcgc tccacgagct 1140
ctatgacgac ggcggccccc agctctctta cggcagcagg acaacgtcag cagggactcg 1200
accgctccaa cagctgtccc tccatcaggc tccgccgcac caccgatagc cacgacatca 1260
cgccagcagg atgcccagat ctctccggct gccacatcgg catgtaccta gggcactagc 1320
tctccctccg ctagacacgt agcactctgc tacatcccca ttgtacacct gggtcctctc 1380
cttacgacta taaaaggaag gaccagggtc ttctcagaga aggttggccg cgcgggaccg 1440
aggacgggac aggcgctctc ttggggccgc tcgcttccct cacccgcgtg gacgcttgta 1500
acccccctac tgcaagcgca cctgacctgg gcgcgggacg aacacgaagg ccgcgggact 1560
tccacctctc tcacgctcgg ctccggccgc ctcgcctctc ccccctccgc gctcgcccac 1620
gcgctcgacc catctgggct ggggcacgca gcacactcac tcgtcggctt agggaccccc 1680
tgtctcgaaa cgccgaca 1698
<210>129
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA16510外部嵌套正向引物
<400>129
aacaacaagg cgacggtgat 20
<210>130
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA16510外部嵌套反向引物
<400>130
tcatcttcgt cgtcctcatc 20
<210>131
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA16510内部嵌套正向引物
<400>131
gatcatcctg ccggagtt 18
<210>132
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA16510内部嵌套反向引物
<400>132
aaccgaaaac acaccctc 18
<210>133
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1719外部嵌套正向引物
<400>133
ccagcggtag attatataca g 21
<210>134
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1719外部嵌套反向引物
<400>134
cggtttggtc tgatgaggc 19
<210>135
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1719内部嵌套正向引物
<400>135
ctcgggaacc ttgttggga 19
<210>136
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物MZA1719内部嵌套反向引物
<400>136
tgaaatccag aacctccttt g 21
<210>137
<211>50330
<212>DNA
<213>玉蜀黍(Zea mays)
<220>
<221>misc_feature
<222>(0)...(0)
<223>非同线性序列
<220>
<221>repeat_region
<222>(537)...(7229)
<223>高度重复区域
<220>
<221>repeat_region
<222>(7536)...(11292)
<223>高度重复区域
<220>
<221>repeat_region
<222>(12554)...(25411)
<223>高度重复区域
<220>
<221>repeat_region
<222>(29087)...(43016)
<223>高度重复区域
<220>
<221>misc feature
<222>48839,48840,48841,48842,48843,48844,48845,48846,48847,
48848,48849,48850,48851,48852,48853,48854,48855,
48856,48857,48858,48859,48860,48861,48862,48863,
48864,48865,48866,48867,48868,48869,48870,48871
<223>n=A、T、C或G
<400>137
taaaaacttg atttagaaac tcagctagtg cttttggcaa ccaaacccca cagccaaaca 60
gctgcatgtc tagaggtaga ggagtagact cctcacaccg ggtaagtcta gctgagtatt 120
agtatactca gccttgcttg tggcataatt tttacaggtt ctctggagga aatggttgct 180
ggagtgactt ggccgtccat cttgccaccg ggttggactg tcgagtggga ccctgccttg 240
gctgaggagg agcatgagga gtgatgggac aggcttcccc atctctctat ttatttaccg 300
ttagtttatt tccgctgcac ttcgaacaat gatggttact tttgcaaaaa ctccgaggat 360
gatgatgatg gtgatgtaat aatttaatac tctgacatgt atggttttat gctttattgt 420
atttgctctg tgactcacct tcgagtgaga ttgtggtact tgatcctgtc agtggccgtg 480
tcggactaga tccgagggat tgacgggtta ttcccaatta agtgtggtct agcctctaag 540
gcggggctta ggcacttaag ttggaataat tcgggcagtt ccgccacaaa tagagtgctc 600
ggatgaaata gcaatttttc ctaacccttt caccttgcct tggttcccat cactgaatat 660
gattgaatct tggggatcct tgttcttgac gtaggaagag aacatcctct tttcccccgt 720
catgtggttt gtgcatccgc tgtcgataat ccagcttgag cccccggatg cataaacctg 780
caaggcaaat ttaggcttgg gtcttaggta cccaactcat gttgggtcct acaaggttag 840
ttacaatagt cttagagacc caaatgcaag tcttgtctcc cttacatttg gcccctaatt 900
tcctagcaat taccttctta tcctttctac aaatagcaaa ggaagcattg caagcataat 960
aaattgtaca aggttcattc attactttcc tagggacatg aacaatattt attctaggca 1020
tatgatgaac aacatttttc ctagcaaatt tttatcatgc ataatagaag aactagaagc 1080
aatcatggca tgagaatcaa aagcatcata acttctatac acattcctag aatgtctcct 1140
atcatgatac atgaaagcac ggttcttttg agcactacta gccatagggg ccttcccttt 1200
ctccttggcg gagatggaag ccttatggct tgttaagttc ttgacttccc tcttgaagcc 1260
aagaccatcc ttaattgagg ggtgtctacc aatcgtgtag gcatcccttg caaattttag 1320
tttgtcaaat tcactcttgc tagtcttaag ttgagcatta agactagcca cttcatcatt 1380
caatttagaa attgaaacta ggcgttcact acaagcatca acattaaaat ctttacacct 1440
attgcaaact acaacatgtt ctacacaaga tgttgattta ttagctattt ctaacttagc 1500
actcaaatca tcatttatgc tctttaagct agaaatagag tcatgacatg tagacaattc 1560
acaagaaagc atttcattcc ttttaatttc taaagcaagg gatttttgtg cctctacaaa 1620
cttatcatgt tcttcataca aaagatcctc ttgcttttct aataacctgt ttctatcatt 1680
caaggcatca attaattcat taatcttatc aactttagtt ctatctaggc ccttgaataa 1740
acatgaatag tctatttcat catcgctaga ttcttcatca cttgaggaag cgtaagtact 1800
agtatcacga gtgcttacct tcttttccct tgccatgagg caggtgtgat gctcattggg 1860
gaagagggac gatttgttga aggcggtggc ggcgagtcct ttgttgtcgg agtcggacga 1920
cgaacaatcc gagtcccact ccttgccaag gtgtgcctcg cccttagcct tcttgtaagt 1980
cttcttcttt tccctcttgt tcccttgttc ctggtcacta tcattatcgg gacaattagc 2040
gataaaatga ccaatcttac cacatttgaa gcatgagcgt ttcccctttg tcttgttctt 2100
gttgggatgc tccttacgac cctttagcgc cgtcttgaaa cgcttgatga tgagggccat 2160
ttcttcatca ttaagcccgg ccgcctcaac ttgtgccacc ttgctaggta gcgcctcctt 2220
gctcctcgtt gctttgagag caatggtttg aggctcttgg attaggccat tcaatgcatc 2280
atcaacgtat ctagcctcct tgatcatcat ccgcccgctt acgaactttc caagtatctc 2340
ctcgggcgtc atcttggtgt acctaggatt ctcacgaata ttgttcacaa gatgtggatc 2400
aaggacagta aaagacttta gcattaggcg gacgacgtcg tggtccgtcc atcgcgtgct 2460
tccatagctc cttattttgt tgacgagggt cttgagccgg ttgtatgttt gggttggttc 2520
ttcgcccctg atcattgcga atctcccaag ttctccctcc accaactcca tcttggtgag 2580
catggtgacg tcgtttccct catgagagat cttgagggtg tcccaaatct gcttggcatt 2640
atccaagccg ctcaccttat ggtattcatc cctgcacaat gaagctagaa gaaaagtagt 2700
agcttgtgca tttttgtgaa tttgctcatt aatgaacatg ggactatccg tactatcaaa 2760
gtgcattcca ttttctacta tctcccatat acttggatgg agagagaata agtggttgtg 2820
cattttgtga ctccaaaatc cgtagtcctc tccatcaaag tgggggggtt taccgagggg 2880
aatggaaagc aaatgagcat tgaaactttg cggaatatga gaataatcaa aggaaaagat 2940
tgaattaacc gtcttctttt tctcgtagtc gttgtcatcg tccttttggg aagaggaaga 3000
ttcgtcgctg tcgtagtaga ctatctcctt gatgcgcctt gttttcttct tcctcccgtc 3060
gtttcttttg tggcccgacc ccgagtcagt aggcttgtca tcctttagat cattgacgaa 3120
ggactccttc tccttatcat tgaccaccat ccccttgccc ttaggatcca tctcttcggg 3180
tgattagtcc ctttcttgaa gagaacggct ctgataccaa ttgagagcac ctagaggggg 3240
gggtgaatag gtgatcctgt aaaacttgaa acttaatgcc acaaaacttg attagtagtt 3300
agcacgatta aagccaagtg gctagagagg agttcttgca agacccgata accacaagag 3360
gattaatcac atatagacac agtggtttat cccgtggttc ggccaagttc aacacttgcc 3420
tactccacgt tgtggcgtcc caacggacga gggttgcaat caacccctct caagtggtcc 3480
aaagacccac ttgaatacca cggtgttttg ctttgcttta ctatatcccg cttgcgagga 3540
atctccacaa cttggagcct ctcgccctta cactttgatg ttcacaaaga agcacggagt 3600
aagggaggga tgagcaacgc acacaagaca caaaattaga gtgacaatac gcacacaagt 3660
cacaacacga gctctcaaca caactcaaag agttctctac tcaaatggag ctctagttgc 3720
tatcacaaag aatcaaatgc gcggaatcga agtcttggtg cttagtaatg cttagagaat 3780
gcttggtgta ctcctccatg cgcctagggg tcccttttat agccccaagg cagctatgaa 3840
ccgttgagat cattccaaga aggcaattct tgccttctgt cgcctggcgc accagacagt 3900
ccggtgcacc accggacact gtccggtgcg gatttctttc cttctttggc gaagccgacc 3960
gttggagatt cagagtcgtt ggcgcaccgg acactgtccg gtgcacaccg gacagtccgg 4020
tgcccccttc tgaccgttgg ctctgccacg cgtcgcgcgc gaattacgcg gccgaccgtt 4080
ggcccggctg actgttggct caccggacag tccggtgcac caccggacag tctggtgaat 4140
tatagccgta caccaccgtc aaagtcccga gagcagccat ttgacagacg ccagcctggc 4200
gcaccggaca ctgtccggtg caccaccgga cagtccggtg caccccgacg agcagccttt 4260
tggctgtaca cagccaactt ctccaaaatt gtttctccta tttctagcac ttagacacaa 4320
tacattagtc ttcaaaacaa tgtactaagt ctagaaacat acctttaatc ttgatttgca 4380
cttcttgagt ccatggcaca atttaacact tatgcacttg tgttggacac ttaatcacca 4440
aaatatttag aaatggccca agggcacatt tccctttcac ctgcaatatc tccaccaagg 4500
agagctcccc ctcgacaaag ccgaagctcg gtgactggcg cggcgcgcca agtcgttcgt 4560
cttactgggc gatgaaaagg agctctacca ccgcatcccc tcaggcatcc tccaacgatg 4620
catatccatc gctgaaggac aggagctatt gcaagagata cactcgaggg cttgcggtca 4680
ccatgtagca cctcgagccc tcgttgggaa cgccttccga caaggcttct actggccgac 4740
cgcggtggcc gacgccacta ggattgtacg ctcctgccaa gggtgtcaat tctacgcaag 4800
acagacgcac ctgcccgctc agaccctgca gacaataccc atcacttggt catttgttgt 4860
gtggggtctg gacctcgtcg gtccattgca aaaggcacct ggggcttctc gcacctgctg 4920
gtcgccatcg acaaattctc caagtggatc gaggtccgac ccctaaccag catcaggtcc 4980
gagcaggcgg tggcgttctt caccaacatc gtccatcgct tcagggtccc gaactccatc 5040
atcaccgaca atggcaccca gttcactggc aagaggttcc tggacttctg cgaggaccac 5100
cacatccggg tggactgggc cgccgtggct caccccatga caaatgggca agtggagcgt 5160
gccaacggta tgctcctgca aggactaaaa ccgaggatct acaacgacct caacaagttt 5220
ggcaagcaat ggatgaagga actaccctcg gtggtctgga gtctgaggac gacgccaagc 5280
tgagccacgg gcttctcacc gttctttcta gtctatgggg ccgaggctat cttgcccata 5340
gacttagagt acggttcccc gaggatgagg gcgtacgacg accaaagcaa ctagaccagc 5400
cgagaagact cactggacca gctggaggag gctcaggacg tggccttgct acacttggca 5460
cgatatcagc agtctcgacg ctaccacgcc cgaggtgttc ggccccgaga cctccaagtg 5520
ggagacttgg tgcttcggct gcggcaagac gctcgagggc gccacaagct tactcctccc 5580
tgggaggggc cattcatcat ctccaagatt ttgaagcccg gaacttacaa gctggccaac 5640
aatcaaggcg aggtctacaa caacgcttgg aacatccgac aactacattg cttttaccct 5700
taagatgttt tcaagtcgtt catatacctc attttctatt caaataaagt ctaaccgtta 5760
aggaagggtc agccttgcct cggcaaagcc cgaccctccc tcgggggcta gaagggggga 5820
accccctctg cgtaaaaaat ttcctcggaa aaagtctttc tgccagaaca tctttcgcgc 5880
tttttgactg cttcgatagc gggatcctga aaacgacgga gtacacgtaa gcggcaaggc 5940
cgaccgagcc gagggactcc tacgcctccg ggatacggat acctcactca tcaccttctg 6000
tgataagtaa ctcacgctcg gataagcgat tttgctgacc gaacaagtgt taacgctcga 6060
aaacttttct gccagaacga ttttcgtgcc ttctcgacta tatcgataac agaatcctac 6120
ggacgagtaa gagtgcacgt aagcggcgag gccgaccgag ccgaggaact cctatgcctc 6180
cgggatacgg atacctcact catcaccttc tgtgaaaagt aactctcgct cggataaacg 6240
attctgttac cgacgaacaa gtccagatac tcgaaataag aggaaaggaa acgcagcttt 6300
acaacacaac aatgatatgt ttgggcctca gcggccgcga aaaacatacg cacactacag 6360
acaaactctc cctgcaggtt cagacatcag cagagggagc agcagcaccc tcgacgtcgt 6420
ctccaccttc ggcggaatct ggcccggcct tggacggcga cgtgggcgga aggatctcca 6480
cctcgaagat ggaagccaac accaagctcg ggccatcata gccaaggtct ccgtaagggt 6540
cccggcccgg gcaaacgcct cgaccggccg ctccgtagcc tcagccagct gtcccccgag 6600
gacatcagcc cgactcatgg cctcgacagc ctgactccgg ggttggtccc gccagcggac 6660
gacctggcca ggttccagcc gccgctgttg cacctcctcg accagggagg ccaagtgctc 6720
ctaggccaac gaagcttctt ctcgagccga ctcagcctct gtccacactg acaccgctgc 6780
ctccggctcc ggctcatcgc agagcggccg agggttcttt aactgagcaa gagaagcctt 6840
gggtggcaag gccgaccgag ccgagggact cctacgcctc cgggatatgg atacctcact 6900
cgtcaccttc cgcagtgggc aactcacact tggttaagcg gttcagctag ccgacaggcg 6960
agtcctggtg ctcgaaatga ggaagaaaca tggtattgca ctcaaatacc tagatgttca 7020
ggcctcgaca gccataatga acaaacaccg gcactcaagg tgccattaca aacggaactc 7080
cggttccact cccgcgggta tgaacaacct ccacatcgga gggcctgcgg gacgacaaac 7140
tctagttggc tcgccgccga ccgctccatc agcagcgaca acgacctccg ctccgggcgg 7200
ctgaacagca gcagcgatga cctcagggca gacgctgctg cgacaaggcc ctcgcccgca 7260
tccccactcg aggggcgagg acaagctatc aaagccgaag agccggaggt ccgaccgcag 7320
gtggcgccga gaaaccttct ctggctgcca ccacctcagc accgacgacg gcagccacct 7380
gcccaccaac acccgccggg ccgtgaccaa tgtgctcggt tggcactgtt gggtcatgcg 7440
cagggttgcc tcgagtcgcg gcaccggttc cgcagtcgag aaggcgcggg aggaggcgcg 7500
acggtcgata tagccaaaag cgggccagca gtaatggcga cagcaggcga gcggaagcag 7560
cagtcaagtt gtctgcaggc tcacgtcccc tacctggcgc gccaactgtc ggcgtttcga 7620
ccccaggggg tccctggacc aacgagtaaa ttgtcgctgc gtgccccagc ccagatgggt 7680
tggcgcgaga cggaacacag agggggggaa aaccgcggct tcgtgttgtc ctgcgccaga 7740
gtggatgcgc ttgcagtagg gggttacaag cgtccacgag ggagagaaag agagagtgcc 7800
tgttcgtcgg cccgtcctcc cgcgcgacca ccctcccgta tgagggccct ggaccttcct 7860
tttatagatg taagaagagg gtccaggtgt acaatggggg tgtagcaata tgctaacgtg 7920
tctggcagag aggagccaga gccctatgta catgccaacg tggctgtcgg agaggtgcta 7980
gagccctgtg catgcgatgt cgtggccgtc ggaggagcac ttgagccctg tagaagcaca 8040
actgttgggg ctgtcgggac cttgctgacg tctccttact tccgtaaggg gctgagagcc 8100
gccgtcgtca tggccgcacg cggggagcca tcattacttg ttaccggggc gagcctggat 8160
gggacaccga tcttgttccc tgtagcctga gctagctagg ggtagggtaa tgatgatccc 8220
ccctgtggcg tggtcggtcc gagcccaagg tcgggcgagg cggaaactcc tcctgaggcc 8280
gaggtcgggg ttgggtgagg acgcgattcc ttctgaggtc ggggccgagg tcgagccctg 8340
gggtcgggcg aggcggagac catcctccga ggtcgaggtc gaggctgagc cctggggtca 8400
ggcgaggcgg agtccatctt ccgaggccga ggcgagggcc gagccctagg gtcgggcaag 8460
gcggagactt ctcctgaggc cgaggcctaa ggtcgggcga ggcggagctt cctgtggcgc 8520
ctgaggctgg actcagctgc tgtcagcctc atcttggcag gtggcacagc agtcggagcg 8580
gggcaggcgg cgctgttttc ttgtcaggtc agtcagtgga ggggcgacgt gactgcggtc 8640
actttggccc taccgactga ggaacgtgcg tcaggataag gtgtcaggcg atccttgcat 8700
tgaatgctcc tgcgatacag tcggttggtg aggcgatctg gccaaggttg cttcactgcg 8760
aagcctgccc gagctgggcc tcgggcgagt cgggggtgcg ctcgtttctt tgaggaggcc 8820
ctcgggcgag gcgtgaatcc gcctgggtct actgttcctg cccgaggctg ggctcgagcg 8880
aggcgagatc gcgtcccttg tcacacccgg atttcagggc accaagaccc gggcgcgaac 8940
ataatcacca ggtgtgctgg gaccaagtct cacacatatg atgattcatg gcacaggatc 9000
gaatgtcaca tctttactac ataacaggag ttctatacaa aataaataag taattacatt 9060
ataaggagac aacggtccag caacccaaag ttgactggga gacgacgacc tagatctctc 9120
tcacgaactc atcgcagcat cctccatgcg cctcatcctg cggtacttgt tcttgacctg 9180
tggggggggt gagacagcaa gagtgagctc acatacgttc atcgctcaac aagttgtggg 9240
gaataatgtg catgatctcg ccaaaggtgg gagctcacgt gaagtgtaag gcttaccaaa 9300
gaggatggtt agagctgagc attgctttta aagttggtca aaattttatt agcaattact 9360
aagtataagt aaataccaac ccaattaagt agtagaacaa aagtaacaac atcacctgcg 9420
atgcaatgca tatgacaaat tgagtttaag ttccataatt taatcatcag agagtcctga 9480
gctgctcatg accgtgagct cggctagtat accagtttta cactctgcag aggttgtacc 9540
ctttacccac aagtcatgtt acccatttgc gaagggatcg cgacttccca tacacctcta 9600
ccaaggaggc gaggcagggt aacactacga ggcctttaca aagttccact agcttcagaa 9660
aacccgctac agtttatagg aagctccaat gcagggttct tgcctgaccg ccatcgcagc 9720
aaaatcaacc aaggacctcc ctacactgac cactccccta ctgcccttgc ccctttcggg 9780
taaggtagtc ctccactggc tttcctaatt aatcagccaa gagcgtccat aaacccttgt 9840
ggtggcacgt gtttctcaag ttaagctcta tgttccaatt aacattaatg atcttgacat 9900
gaacataaat agaataacaa aataactgga acatagatat gataattaat tatcccaaat 9960
ccatgtaaag caatagcaaa ctacccaagt gattcagggg taaacaaggt aatgagataa 10020
acaatctagg gtaacctatt gggtcccatc aaaattaacc tatgcatgaa tagtgataat 10080
aacgaatatt attgggtaac agaagtgatc aagggcacaa cttgccttta atgagcacct 10140
gctcagctac ttcaacctgc tgctcaccag gatcctcatt cacgggctct tctactcgcc 10200
acaatacaaa caagcacaat atatagagaa atcaacatca caccaaacat gtaaacaaac 10260
tacacagtaa taatctatgc attaaaataa aatcctagga acagaaatca taattttcgg 10320
agttatagat tttaagttat ggattttcaa aggttttatg tgtttaaaat agattaagtg 10380
aggaattaaa tttcttactg ttttcatgac aaaacagagg ctctaagtga tagagaatta 10440
aattacaaaa atttagaaag tggaatggag taatttgggg ttcatataca ttttctatga 10500
attattgaag ttctagcaat tattttccta ttaaaaatcc cttttccaat ttatttactc 10560
aatttcaaac agctctggat cgagcctcaa ttaccgaaaa gtgcaggggc ttctgcgcat 10620
aattttctaa gactcagaat actatgcagt ggacggcggg tttattcctc ggttttccag 10680
ggtttctctt acaaaactga cccgcgaagg ggtatcagcc gatctcggcc gcaggatgtg 10740
aagtggacgg cccagattaa ttcatacaac ttaacaaatc ggtatgcacc caaggcccac 10800
ggatacgaaa tccatgaccg agagagttcc acgtcattga cctaacctaa ccatcggatc 10860
tataaccagt ggctcagatt tcatctgcga aggaggtatg ctgtatataa tctcgctcgt 10920
ccattcagat cgaacgatcc acatctagtt tgaacccgat ctaatctaga tcgttcgtac 10980
acagatcaaa ggcccacggc aagcgcttct cttccccctc cggccacccg tgcggccagg 11040
gacagggcac cgcggcggcg ccatcgccgg caacacggtc ggtcggcccc tacagcctta 11100
acccgagcga taaatggtgc aaacgggaga ggaagagatg caaaaccaaa tgggagcgat 11160
tttaccgtga atcgagtagc aggactcgcc gcccacggag acacgcaggt tcacagcaag 11220
agttgatgcc cgacgaggaa tttcccggcc atggctcgcc cagtcgactg gagagcgcct 11280
agcccgcgtt cgggtatccc tcacgaacac cccaaaccac atgccgaggc tgtagagtcg 11340
ccccagggtt gaatcgaccg aggcggtcat ttctcccctg accacggcga agagcggcac 11400
ggtgcgcaac tggttttcct gatagtgggc accggcgtga aattaggccg ccaactcgcg 11460
ccccgatgca ccgacccaca atcgccaagg cttctgctgc gcaaacgagt tccccgctgt 11520
gatggccgaa gcacagcaca gcaggtggac ggcagcggac cagtcgcggc ggcgcacaga 11580
ttggggcgag cagggaggag aagaggaaca gcggcttcgg gtgttatagg cgcagggtaa 11640
aggaggggac gaacaggtca cgctggcgcg atgccgcacc tatatgacga gtccgggctg 11700
aggacgttaa ccgggcggcg ctagaatcct ggggcttcgg cagaggccgt tgcgggagta 11760
gcggcgggca ggtgtgccgc cagcgctgta cgcggggtcg gggcacggag gttgttgcgc 11820
taggggtccg cgatttccgt gaatcgggca cgagctcacc agcgccaccg gttttgcgca 11880
cgaagcggag gaaatgtagg gagggagaag aagaccactg ccggctgggt ggataagtta 11940
gctgggtgac cctggaatgt ggggcccgcc tggcggcgac gcgaaggcca cacgagcgag 12000
tgaggggcgt tgggtcgtgc ggtatcggaa aaaaaagaat gggccgaaag tgaggattcg 12060
gcccaagtag tgttttattg tttttctttt tcttattttt tttcaaattc aactttaaat 12120
tcccatttaa attcaaattt agtggtggat ctatcttcac attaatttcc caacttaaac 12180
atggcatggg tgaacttatt tattttcaat atttatttta ttaaaactag tgctatgttt 12240
ctccaaatta gagtttaaat gctatgtgtc ccttaatata ttaatatatg ggtactaaca 12300
catttatttt actatccaca aatgcacaat caagtaaaaa ctcagcatga tgcataattt 12360
atttgagtgt cttctattaa ttatttattg tatagatgag gtgtccacat gaaatggtaa 12420
atagggataa cccacacaca tgtaaaggaa tataatctct ccttttagat ttttcttaca 12480
aagtgggtgt tacatccctt gagtggacgg agccttgacc tgaattgcgc ccaacagcct 12540
ctgcagtttg cgctgatggt gattaccagc cgagtttagg agtcttgggg gtacccctaa 12600
ttatggtacc cgacaactgg tatggacgag tctggtgtgg tatgacaatt agagattttc 12660
tataacctcc gtgaacaggg aaatgtgtgt gtaagtgcat actgaaaaag aaaacaaggc 12720
cacgggagcg ggaagctcag tggtggttga gtattttgtt acttttaagt ctttgggaaa 12780
accttacagc aattgccttt ctctaagaaa atgaagagtg acttcaactc caccaaataa 12840
agcatgtatg atataggtct ctttctcttt acgggagcgc ggtgggcttg cggaatacct 12900
agtgtattca cccatattta tttatgtttt tcagcagccg aagacttctt ttctgctatg 12960
cttgattgag agggctgtgt ctgcacccag ttctgcctgt ggcttgggct agtatatttt 13020
tctactgcgc ttcatcttct ggctctctcg agcttgtacc cccgtattgt aataactctt 13080
atttaaactc tgtactattt gaagaaagga atgtgtttac tagcctcatg ggactactaa 13140
ttgtatcaca tttgagtccc aaaggatcgg gacgcttcag aaaatgtcgg ggaccataat 13200
taggggtacc ctcaagacgc ctaattctca gctggtaacc cccatcagca taaagctgca 13260
aaggcctgat gggtacgatt aagtcaggga tcagtccaca cgagtgactc gatcacgctt 13320
cgcccgagcc tagcctcggc caagggcagc cgacctcgag agacttccgt ctcgcccgag 13380
gccccccttt gtaatggcgg acacacctcc ggctcgcccg aggccctggc ttcgcttaga 13440
agcaaccctg actaaatcgc cgtgccgact gaccaggttg caggagcatt taacgcaaag 13500
gtggcctgac acctttatcc tgacacgcgc cccccggcag agccgaagtg accgccgtca 13560
ctccaccgct ctactgacca gtctgacaga aggacagcgc cgcctgcgcc actccgactg 13620
cagtgccact cgacagagtg agtctgacag gcaatcaggc cttgccaaag gcgccatagg 13680
gaactccgct ccgcccgacc ccagggctcg gactcgggct aagacccgga agacggcgaa 13740
ctccgctccg cccgacccag ggctcggact cgggctaaga cccggaagac ggcgaactcc 13800
gctccgcccg accccagggc tcggactcgg gctaagaccc ggaagacggc gaactccgct 13860
ccgcccgacc ccagggctcg gactcgggct aagacccgga agacggcgaa ctccgctccg 13920
cccgacccag ggctcggact cgggctcagc cccagaagac gacgaaactc cgcctcgccc 13980
gacccagggc tcggactccg ccctggcctc ggccgaacga cctccgcctc gcccgaccca 14040
atggctcgga ctcggcctcg gcaacagaag acagactcaa cctcggcttc ggaggagccc 14100
ccacgtcgcc cgacctaggg cgcaggcccg ccacgtcaac aaggagcgcc atcatcatcc 14160
taccccgagc cgactcgggt cacggagaac aagactggcg tcccatctgg ccagctccgc 14220
cagatggaca atgatggcgc cccacaagct ctgtgacgac ggcggctctc agctctctta 14280
cggaagcagg gcaacgtcag caaggactcg accgctccaa cagctgtccc tccgccaggc 14340
tccgtcgctc ctccgacagc cacgacatca cgccagcaag gtgccaagac ctctccggct 14400
gccacattgg catgtaccta gggcgctagc tctctctccg ctagacacgt agcactctgc 14460
tacacccccc attgtacacc tggatcctct ccttacgact ataaaaggaa ggaccagggc 14520
cttcttagag gaggttggcc gcgcggggac gaggacgaga catgcgctct cttggggccg 14580
ctcgcttccc tcacccgcgt ggacgcttgt aaccccccta ctgcaagcgc acccgacctg 14640
ggcgcgggac gaacacgaag gccgcgggat ctccacctct ctcacgcccg tctcaggcca 14700
cctcgcctct ccccccttcg cgctcgaccc atctgggctg gggcacgcag cacactcact 14760
cgtcggctcg gggacccccc ggtctcgaaa cgccgacagt tggcgcgcca ggtaggggcc 14820
tgctgcgtgc tgacgaacag cttcccgtca agctccagat gggcagtctc cagaaacctc 14880
tccggcccgg gacggtgctc cgtttcggga gtctcgagtt catgtccttc aacggcagct 14940
acgacatgat actccttcct ccgccgcgcg acaacgacaa tggcggccga caacccgccc 15000
gccggcggcg gaatcggcga catcttcccc gcgtggcgga agaacaacat tcgagctcgc 15060
tccgtcctct cccccgccga cggaggagga ggcgaggcaa ccaaggccaa gcgggaggcc 15120
gcgcttcgtc ggctgtcgag cgaatcgacg tccccagcgc cccgacggaa ggcacgccgg 15180
gcgtcgacct cgcgttcgag atggaggcag gcgccgtccc cccgcgacac gctgatcccg 15240
agcaagaaga cgacgccagc gcgctcgcgg gaagcctgca ggacgtcgcc ctcgtacctg 15300
ggatgacggt gcaaccagtc cccgatgtga ctacgtcgct cctcgtcgac caaaaggtac 15360
cgactaactc ccatcttacg tcatttcgac tcggcctcaa cccgccaagc gacctcgctt 15420
tggcgggcgc tctcgttgag gcaagtgcaa ccccactggg gtttcgtatg cggtcgcctt 15480
gggaccggtt gacggacgtc tcaacctacg ggccctccga gtccgaggaa gatgacgatc 15540
ccagcatcta ttgggatttc tctggacttg gcaaccccag tgccatgcgg gacttcatga 15600
ccgcatgcga ctactgcctc tccgactgtt ccgacggaag tcgcagcctt gacgatgagg 15660
gctgcggccc aagccgcgaa tgtttccacg ttgagctggg ggatccctcc gaaggcaacc 15720
atcttggcat gccggaggac ggtgattttc ctaggcccgt gcctcgcgcc gacatcccgc 15780
gggagctagc tgtggtcctc gttccggcgg ggggtcacga cccacagctc gagcgagtcc 15840
gcggggcgca ggctaggctc gacgagggaa caggagcgct tgagacgatc cgccgagacg 15900
tagggcaggt atgggcgggc caacccccgg gccggagaaa tacgtcacct gccccagggt 15960
ctccagcacc gcgtcgccaa cgatgtcagg gtcaggccgc cgcccgcatc cagcggggtt 16020
ggtcagaacc tggcagccgc agcgatgctc ctccgcgcga tgccggagcc atcaaccacc 16080
gagggtcggc gaatccaggg agagctcaag aatcttctgg aaggcgctgc ggcctgacgg 16140
gccgagagca ctgcctcccg aaggtaggga tatccctcgg aacctcatgc cgcgacttcc 16200
cgattcatgc gggaagcctc ggtctacacc gggcgcacgc gtaacaccgc gcctgcggcc 16260
ccgggccacc tcggcaacga gcaccatcga cgcgaccgtc gggcccacct cgacgaaagg 16320
gtgcgccgag gctaccaccc caggcgtggg ggacgctacg acagcgggga ggatcggagt 16380
ccctcgcccg aaccacccgg cccgcaggcc ttcagtcggg ccatccgacg ggcgccgttc 16440
ccgacccggt tccgaccccc gactactatc gcgaagtact cgggggaaac gagaccggaa 16500
ctgtggctcg cggactaccg cctggcctgc caactgggtg gaacggacga cgacaacctc 16560
atcatccgta acctccccct gttcctctcc gacactgctc gcgcctggtt ggagcacctg 16620
cctccggggc agatctccaa ctgggacgac ttggtccaag ccttcgctgg caatttccag 16680
ggcacatacg tgcgccccgg gaattcttgg gaccttcgaa gctgccggca acagccggga 16740
gagtctctcc gggactacat ccggcgattc tcgaagcagc gcaccgagct gcccaacatc 16800
accgactcgg atgtcatcgg cgcgttcctc gccggcacca cttgccgcga cctggtgagc 16860
aagctgggtc gcaagacccc caccagggcg agcgagctga tggacatcgc caccaagttc 16920
gcctctggcc aggaggcggt tgaggctatc ttccgaaagg acaagcagcc ccagggccgc 16980
ccgtcggaag aggctcccga ggcgtctact ccgcgcggcg ccaagaagaa aggcaagaag 17040
aagtcgcaat cgaaacgcgg caccgctgat gcggaccttg tcgccgccgc cgagtacaag 17100
aaccctcgga agccccccgg aggtgctaac ctcttcgaca agatgctcaa ggagccgtgc 17160
ccctaccatc agggacccat caagcacacc ctcgaggagt gcgtcatgct tcggcgtcac 17220
ttccacaggg ccgggccacc cgccgagggt ggcagggctc gcaacgacga caaaaacgaa 17280
gatcaccaag caggagagtt ccccgaggtc cgcgactgct tcatgatcta cggtgggcat 17340
gcggcgaacg cctcggcttg gcaccacaag caagagcgcc gggaggtctg ctcggtgaag 17400
gtggcggcgc cagtctacct agactggtcc gacaagccca tcaccttcga ccaggccgac 17460
caccccgacc acgtgccgag cccggggaaa tacccgctcg tcgtcgaccc cgtcatcggc 17520
gacgtcaggc tcaccaaggt cctgatggat gggggcagct gcctcaacat catctatgcc 17580
gagaccctca agctcctgcg cgtcgatcag tcctccgtcc gggcaggcgc tgcgccattc 17640
cacgggatcg tccctgggaa gcgcgtccag cccttcggac gactcgacct ccccgtctgc 17700
ttcggaacgc cctccaactt ccgaagggag accctgacgt tcgaggtggt cgggttccga 17760
ggaacctacc acgcggtact ggggaggcca tgctacgcga agttcatggc cgtccccaac 17820
tacacctact tgaagctcaa gatgccgggc cccaacgggg tcatcaccgt cggccccacg 17880
tacaaacacg cgttcgaatg cgacgtggag tgcgtggagt acgccgaggc cctcgccgag 17940
tccgaggccc tcatcgccga cctggagaac ctctccaagg aggtgccagc cgtgaagcgt 18000
cacgccggca acttcgagcc agcggagacg gttaaggccg tccctctcga ccccagtggc 18060
gacacctccg agcagatccg gattgggtcc gggctcgacc ccaaatagga agcagtgctc 18120
gtcgactttc tccgcgcaaa cgccgatgtc tttgcatgga gtccctcgga catgcctggc 18180
ataccgaggg atgtcgtcga acactcgctg gatactcgga cctgagtctg atccgtcagg 18240
cagcctctgc gcctcggtca tcaaggaagg gtcggccttg cctcggcaga gcccgaccct 18300
ccctcggggg ctaaaagggg ggaacccctc tgcgtcgaga ttgggcatac ttctccgcat 18360
cgaaaatttt caatcaaaaa aggggcctct tgcgttctcc tggctatgtc agaagcaggg 18420
tttcaaggag cgaacatggg tacatgtaaa tggcaaggcc gactgagccg agggactcct 18480
gtgcctccgg gttagggata cctcactcat cacctgccac gaagaatgac ccaactcgag 18540
aagccaccct attattgaca agctaggacg aacacgcaga tggaaagaaa ggagggtacg 18600
acttcatgca agaaagacaa agtgttcagg cctcagcggc cacggtgaga cgcgcatcca 18660
acaagaaatt gttcaaacaa gaattaggcg ccgccttggg aaggagccgc gccctcagct 18720
tcgtccccgc cgtcggtgag gtccatctcg gcctccggtg atggcgcagg gggaaggatc 18780
tccgcctcaa aggtggtcgc cagcaccgtg ctcggacccg cggcgaccgc gtcaagccgc 18840
tggacctctg ccagggcagc atcgtcttcg tcaggaagac agtacccctc actaacccgc 18900
tccaggtcca cgacgtagtg ggaagcgagc acggcgaagg cccgcctgac gccgtggtgt 18960
agcgcctcgc ggactctgcc gcgcgtgtga tcacccaagg ctcgaaggcg gctttgaggg 19020
gagcttcctg aagggacgtc gccagagccg aggatacgat aaaagtccga gacggcctcg 19080
gacatggccg cgaggtcagc ttccctctgc tcggcagctc cggcaagcgc ctcggcgagc 19140
gccttggcgg actcatcaag ggcggactca agctctgcga gcaaccagga gaaatacctc 19200
aagcacaagc aaaggaaacg gacaagaaca agaaccaggg aggaccaaga catacctccg 19260
gctcggacac gatgctccga ggccgcgacc tgggccgcgg ctaggtcggc cgcgagggtc 19320
tcagctcggc tttcggcctc ggcagcccgg ccccgagatt ggtcccgctc ctcgacgacc 19380
tgggcgagct ccgatcgctg ccgttgcgcc tccgcacgcg ctgctgccgc ctcggccctc 19440
aggtcggcgc agagcagctg gaggtccgct accttggcat cctgctgaga aaggcgcgcg 19500
gtagccccgg cgagcgagga cctcagggat cgcagcgagc cctagacgtc gacctcgcgg 19560
cggatgaacg acgacttggc ggcgctccgg tctgacagat cctggggaaa ggaaacaggg 19620
cgtcacgacg agtgcctcgc tcacagaagg aaaaaggtat gcctgaaacc gctacctgga 19680
ggattttggg gacgtctctg cagaaaacct ccagcgatga ccggagcgac cccaccgttg 19740
cctcagcaca ctcgcggagc tcatcccagg actggtcctc ctgctcatcg tcgagaacga 19800
agacagggtc cgaggcctcg ccggtccgga atcggagcaa cgggcgccgg gcctcggggc 19860
ttcgccacac agcgatgagg ctgtcacccg gctggacgga tcgcgcgtcc acgcccacct 19920
cttctgaggc cttgggcgcc gacgcatcag ccatcccgac actggcggca actggtcgct 19980
ctccgacagg gacggcgaca acctcggcgg tggcgggcgc cggcatggcc ggcacgacag 20040
gcgggctcag ggccacgttg gcgtcagccg cctcctcaac cacgatggcc gcctcggcag 20100
aagagccggc ctcgggagcc cgcttctcag agaccggcga cgcccgagcc ccctgcggtg 20160
aagtaccccg cgaaagggtt ggctgaatga caaggcccgg ggcggcgctg gccacacagt 20220
ccggcgccgt cttgagggcc ttccggggtg ccaggtcggt ctggccatga ctttgcttgc 20280
tggatataaa aaaagaggag gaaagaaaga tcacggccga gacatatgaa tgggaagcca 20340
agacgaagac gtcccgggat actcacccac ttcgggccat tatccaccgc gcctgggggg 20400
aggtctcttg gatcccggct cccaaggcgg ccgccgaggt ccgcttcgcc ggcattttcg 20460
gcgccaccct cgccgtggac gcccgggaag aagattgccc gggcgcggtt gcgacgacct 20520
gagggtcacc cccatgcgcc accggtgcga gcggcggccc ctcgggagcg gacgccctga 20580
cctggccctc cggagccacc tcagctcctc cggccgaggg aacaggtgac acctcgggtc 20640
gcccccgtgc ctcggactgg gaccccgacg ccccaactcc ggggactgat ggtgtcggcc 20700
cgcgcggggg ctggctcgac gactcctggc cgcaccccga gccggggccg aggccgagac 20760
gggcggccat gtcgtcctcc tcctcatcat cgtcgtcatc gtcgtcgtcg ggcgtctccg 20820
gcgacggctc cctcgggagt ccttccctct cctgctggcg acggcgcttc tccaaggcgt 20880
cccgagcccg cctccgctcg cgggcccggg ccttctccgc gtccttcttt ttcttcttct 20940
cctccgcggc gactcgccgc gctgcacggt ccaccgcatc ctccgggacc cgtggcaggg 21000
agggcttgtg ccaccccaca tcctaaaagg aggggagaaa ggaacccgat cataaggacc 21060
cggaacgacc caatgtacga agaaggaagg agcgaacact caccaaagtt acgcacccct 21120
ggtcggggcg catccgaagc tgggagtatg cgtgggggtc cggcttcccc atcgcagccg 21180
acacccgcca ttggagggcg ttgaagggaa gaggatcagg ggacattcgc gagccctccc 21240
agtcagcctc tggggtcatc tcctagagcg acagccgccg ctccgccaat ggaagcaccc 21300
tccgacggtg gatggcagcg atcactcccg cagcggtgag tcccccctcc cgcaactcct 21360
tcagggcctg gagaaggggc tcgaggttct tctgtctctc gtgcggggtc ctgtggcgcc 21420
aggcgtcggt ggcagcagta actactctct gggagaacgg tgggagcaac tcaccgtcat 21480
tccggaggta gaaccaccgg cgctgccacc ccttgttcga ggacgcaaga atggcaggaa 21540
tgtactgtga cgcccgcgac tgcctcagca aaagagtgca gccgccggcc cgcaccgctg 21600
cacggaccct cctctcctcc gtcgacaagg cgaaaagctc ggcgaggaag agatgagtcc 21660
gcaaatccca atggggggcg atccccaagt acccttcgca taccgctacg aagatagcgg 21720
cctgcgagat ggagttgggg gagaggttat gcaattccac cccgtagtgg aacaggatag 21780
ctcgcataaa gcggcccgtc ggcacaccga atccccgctc gtggaaggag acgaagctca 21840
cgacgtaccc cagcggtggg gacggagcgg ctccacccac gggaggaatc cactctggcc 21900
gctgcttatc ggtgaggggg cggagcaaac cctcgccgac cagctcctcc agatcgctcg 21960
ctgtcaccgt ggaaaaaggc cacggatcac gcggggggat tatggtcact cgatccgcca 22020
tcaccaaaat ggaagagatg gcggcgcggg gggcagggag ggcggttttt tctcttctcc 22080
gactaaagtt tcccgggttg cgaaaaccta aagggaaagg aaggaagaag agcaaagaac 22140
cgtcaccgga ccccctctcg agtatatgaa ggccagggcg aaaccgtttc cagcgctcca 22200
cccggaccgg acgcgggatt cgaaaaacgc gaggcgaaac agccgttcct cgaacggctc 22260
gcgcacgcgc aacggccgcc ccgccaacca ctcgccccgt cgcattaact ccgcggcggg 22320
acaggcggcg cctctggcag gagaagcgga cgacgcttcg ccttcgccgt aataaccgcg 22380
tcaaaaaagg tacgccacgt cgttcgattt cgtatccttt tttcctcttt ctctatctct 22440
tgcaacaggg accgggaaag ggggataccc cgaaaaggat ccttctctgt gaaggaaccg 22500
ggctccgagc ccccctactg atcagaggtt cgaaggctgg ccctccgagg ggttcaacag 22560
tcgcctcaga tcgcgtgggc ccgacaccca ctactggtca ggggttcgaa ggccggcccc 22620
ccgaagggct ccatggccgc ctcaggctac tcgggctccg cacccattac tgatcagggg 22680
ttcgaaggct ggcccccgaa gggttcacag tcgcctcaga cgccgagcga gggatgacca 22740
ggggtacgtt cgatacataa ccgaggctcg ggctgcgctc ccgaggtacc ctaggacatt 22800
tccgagacca gcgggaacga tcttgtaacg gaatcccatc ggagggaggc atcgagccct 22860
cggaccccgt cgccagggga ccgggtccgg caaatcaccc gcaggtactt ttgggcgtgc 22920
ctctgggccc ctagccgacc cccaacgaac ggggcacgga cgtccactcg gattacccgc 22980
ttgcagctca ccggagacac catgttcggt gcccatcgag ggtaacatgg cgctctcccc 23040
cctcctcctt gcggaaaggc gacgtagggg cgtatgtaaa aaagccgagt ctgtccctga 23100
tcgtcctctc gccctgtgca gaggctcggg ggctgctctc gcaaacccgg ctccggccaa 23160
accgttgaca gcgtcaacat accagcccga gagcttgggc cctgaccgtg cacccgggct 23220
acggccagtt cgcatgaggg aacaaccaga ccagccgaag cattacgcaa ggcattaaga 23280
cctcgaagga gtgtaaccac tcctccgagg cctcgggggc tacacccggc gggtgcgctc 23340
gcgcgcaccc accggaacaa aatgcaaccg agaaaggctg gtccccttgc aaaaaagtgc 23400
gacgaaagcc tccaagcgag tgctaacact cccttcgagg ctcgggggct actgtcgggg 23460
accataatta ggggtaccct caagacgcct aattctcagc tggtaacccc catcagcata 23520
aagctgcaaa ggcctgatgg gtacgattaa gtcagggatc agtccacacg agtgactcga 23580
tcacgcttcg cccgagccta gcctcagcca agggcagccg acctcgagag acttccgtct 23640
cggccgaggc ccccctttgt aacggcggac acacctccgg ctcgcccgag gccctggctt 23700
tgcttagaag caaccctgac taaatcgccg tgccgactga ccaggttgca ggagcattta 23760
acgcaaaggt ggtctgacac ctttatcctg acacgcgccc cccggcagag ccgaagtgac 23820
cgccgtcact ccaccgctct actgaccagt ctgacagaag gacagcgccg tctgcgccac 23880
tccgactgca gtgccactcg acagagtgag tctgacaggc agtcaggcct taccaaaggc 23940
gccataggga actccgctcc gcccgacccc agggctcgga ctcgggctat gacccggaag 24000
acggcgaact ccgctccgcc cgacccaggg ctcggactcg ggctaagacc cggaagacgg 24060
cgaactccgc tccgcccgac cccagggctc ggactcgggc taagacccgg aagacggcga 24120
actccgctcc gcccgacccc agggctcgga ctcgggctaa gacccggaag acggcgaact 24180
ccgctccgcc cgaccccagg gctcggactc gggctaagac ccggaagacg gcgaactccg 24240
ctccgcccga cccagggctc ggactcgggc tcagccccag aagacgacga aactccgcct 24300
cgcccgaccc agggctcgga ctccgccctg gcctcggccg aatgacctcc gcctcgcccg 24360
acccagggct cggactcggg ctaagacccg gaagacggcg aactccgctc cgcccgaccc 24420
cagggctcgg actcgggcta agacccggaa gacggcgaac tccgctccgc ccgacccatg 24480
gctcggactc gggcttagcc ccagaagacg acgaaactcc gcctcgcccg acccagggct 24540
cggactccgc cctggcctcg gccgaacgac ctccgcctcg cccgacccaa tggctcggcc 24600
tcggcctcgg caacagaaga cagactcaac ctcggcttcg gaggagcccc cacgtcgccc 24660
gacctagggc gcaggcccgc cacgtcaaca aggagcgcca tcatcatcct accccgagcc 24720
gactcgggtc acggagaaca agaccggcgt cccatctggc cagctccgcc agatggacaa 24780
tgatggcgcc ccacaagctc tgtgacgacg gcggctctca gctctcttac ggaagcaggg 24840
cgacgtcagc aaggactcga ccgctccaac agctgtccct ccgccaggct ccgtcgctcc 24900
tccgacagcc acgacatcac gccagcaagg tgccaagacc tctccggctg ccacattggc 24960
atgtacctag ggcgctagct ctctctccgc tagacacgta gcactctgct acacccccca 25020
ttgtacacct ggatcctctc cttacgacta taaaaggaag gaccagggcc ttcttagagg 25080
aggttggccg cgcggggacg aggacgagac atgcgctctc ttggggccgc tcgcttccct 25140
cacccgcgtg gacgcttgta acccccctac tgcaagcgca cccgacctgg gcgcgggacg 25200
aacacgaagg ctgcgggatc tccacctctc tcacgcccgt ctccggccac ctcgcctctc 25260
cccccttcgc gctcgcccac acgctcgacc catctgggct ggggcacgca gcacactcac 25320
tcgtcggctc ggggaccccc cggtctcgaa acgccgacag aaaataaggc catattttcg 25380
gcggctaggg tctagccgcc gaaagtagct tattttcggc ggccacaagt cagtcgccga 25440
aaattacctg ttcttttcgg tgggcctctg acggccgccg aaaataacaa gtgccgaaaa 25500
tagtatttaa aaatacaaaa aataacagaa aattcataca ataacagaaa attcatactt 25560
gagtccacaa cataaaactt aagtccatac aaacataaag tccacaaata gtccatacaa 25620
acataaagtc cacaaatagt ccattacaaa gcacaatgcc gcacaaagct aactccatca 25680
catatcgggg tcgttggagt tgtgtccact accttcagaa gcgaaaaact cgttgacgaa 25740
gtcgtgtaac gggtttagat tctaaagaaa aaagaagaca ttaataacga tattagttac 25800
atgtatgacc actattcaaa caaattgttt ctcaaactaa cctctcatgg agtagctccc 25860
tcccctgcat atgctcctcc tggtgctggt atgagcggtg gtggcgtgtt gtggcccatg 25920
accccggatc cctacaaaat caagtttagt aaagatttga aattagattg atacaaacga 25980
caagtcttaa ctaaattgaa gcacctgagg tggaggtggc ggagcatgta atccccactg 26040
aggcatcgac ggctgaaact gagggaaaac aaatggttgt tgttgtgcct gctgtggaaa 26100
ccaagaccgt tgcaaatata atatgttagt tatagaacca atatcgagcg tgttgagaag 26160
aaataagaca ctcacgttca ttgcttgttg ggcctgtgcg ttgtaagcag ccatgtactc 26220
tgattgctct ttgaggaatg ccatttgttg ttgccgcagc tcttcacgaa actttttttg 26280
ctactccctc atagcctcct ccatgctaga tacagagcgg caactacgcc tgctactaca 26340
acaacccgcc tgcgcgcggg cggtcggcgg cgcgcaggcg tgggcggcgg acagcgcgcg 26400
ggcgtgggtg gctgatttgg gagaggagag agagagagga aaaacaaaga agaagaaggg 26460
cgtcggtttt aaaaagacta ttttcggcgg ccccctggca cagccgccga aaatagcgtt 26520
actttcggtg gccctctgac acagccgccg aaagtagcct tatttccggc ggctgtgtga 26580
gaggccaccg aaaatagcct tatttccggc ggttgtggca ggccgccaaa aatagcagat 26640
aattttcggc ggctataggt gggccatcga aaattacatt ggccgccgaa aatgttcaac 26700
agtgttgttg tgatagcaac caacaggtat gagccacaat actacacatt gcaacttggg 26760
aaagtaattt actggtcacc atatttccga atagctggtt atgatatgat atttacaaat 26820
cttccaattc attccttcag cttaaatgaa tctcattaat tcatctagga aacatctggg 26880
ctgaaacgtc agaacaacag tgttttctac tgttaacatg atccgtttat cttgtaaaaa 26940
acaaggtttt gtaaatggat ttatttttat gctcaaactt aaattgaaca attcaatcac 27000
gcacaattgc tatgctgaca gaagtttatg acaagtttga gcataatgtt gtaataataa 27060
tgagaccctt catgatcttg ttgttattcc acatttccat ctctcctcga agcatagcag 27120
tgcccaccat tttctaccga gtcagcaaca ataatctagg ctgaaagaac aatggacaac 27180
agcttcgtgt gttgtccatc tagtagtcct ttgaataaca gtataatatg cttatgagaa 27240
tcaatattat tttcatggca cacttgtttt tttcatgaat agtttcattt ttgtagataa 27300
ttttcagttc tctgtcacag gtacaatatt tgcctatggt gttacaagga gtggaaagat 27360
acatacgatg catgtgggaa aacttattac aatatttttc ctttaataag ttttaccttt 27420
gtagagtgta tgtttctagt cataggcttt gaagtatgcc tcatgctacc aattaacatg 27480
caaaaacttg gactaatctt actgatacta agatctaaca tagttgtcaa cctccttggt 27540
tggacatttt agttgctttt gttgtattaa gcttttaatt ctctacaggc tgaggatgat 27600
gatggcactg atcttttcgg gacgaaaccg aagaggacaa gaaggctgct gatgagcatg 27660
tccctaccaa ggtctcttat agaaagtctc tttatcgaag aggacaagaa gtgctaacct 27720
acattatttc agttaggggc atgcctttga gaagtctctt tacaatgcaa cgggcaaaat 27780
gcccccgaag caaccctagg gatgatgccg gatccaagtg agacagggca tatagtggga 27840
ggggaagcaa tgggggcata cctgacgacg ttagagagaa agagggcgag gactttggcg 27900
acgaagccgg gtagcaggtt gacaatatta atgtacttga cgcagagact cgagacgggt 27960
gcgacgtcgt agctgtgcag tgcctcaacg atctccaccg gcttcatcag cgggaaggag 28020
agctcgccct cccctccgtc gcaggcacca caggtaaact gctgcattga cgacttcctg 28080
gcgatggctt cctctgtcac tcaaagccgc ggccgccgcg cgctcggcgc atatccttgg 28140
ccgggctggt gtgaggaggt ctaggatggt ggccgggttc cgtcgtacga tctcattccc 28200
aacgcctagg tcctcgacgc cgccaacggg aggcgcgggg cccagcgctg ccaacaagta 28260
tggggcctac cgcgcgtggt tgatgagcct gccatgccgg ttccacctgc gggagctggt 28320
aggccgcctt gcgtcgaaag cctccgtgga ggccatgacc gagggtgcgg catggcgggg 28380
ccgcgtggtc ttgtcactct ccgagctgct gcaccagccg ctgcgccggc tcggcccgtc 28440
cctgtagggt cgcgtcgtcg ggcggggggg gattggattt gtggtggggt gcgtgggcgg 28500
gcatcacgcg tggcgatggc actggaagca cggggaacag ggcaggtgta gggtgggggc 28560
aggcgatgga atggcgcggc atgcttgcgg ccgattgtcc ttgcgtggat ggaggggatt 28620
gcgggctcga ggatgaggat ggcgggatgc gcgcgccttt cgtcgatcga acgtgggcac 28680
gggacgagga ttgcattgcg cggccacgcg ggggcgagat tggcgtcgtc ggtgggatgt 28740
aggcttcgat gactgtcagc ggggtgggac gtgaatcacg ggggcgaaac aattgctatt 28800
ttagcccttc taacgtgggc tctctgctat tatgtgaccc tctgtctatg acttgtgtga 28860
ccatttgtgt ctatgatttg tgggactggt ggtaaaatag agaagttcac aactgagagt 28920
gacaaaatag caaattctcc cacgggggcg ggggcacgac gcaccagtgt ggacgtccac 28980
actatagcct tatagagtag tggagattat tttttttaat taaactatac ttaatatttc 29040
tacttaacat aatatttgat gtaacatgga cgactaaact tttccctcaa gccggtatta 29100
caaggacacc gggacacgtg ctgtgcggtg acaaaactgt cggggaccat aattaggggt 29160
accctcaaga cgcctaattc tcagctggta acccccatca gcataaagct gcaaaggcct 29220
gatgggcacg attaagtcag ggatcagtcc acacgagtga ctcgatcgcg cttcacccga 29280
gcctagcctc ggccgaaggc agccgacctc gagagacttc cgtctcgccc gaggcccccc 29340
tttttatggc ggacacatca ccggcttgcc caaggccttg gcttcgctca gaagcaacct 29400
tgactaaatc accacaccga ctgaccaaat tgcaggggca tttaacgcaa aggtggcctg 29460
acacctctat cctgacacgc gcccccggca gagccgaggt gaccgccgtc actccaccgc 29520
tccactggcc agtctgacag aaggacagcg ccgcctgcgc cactccgact gcagtgccac 29580
tcgacagagt gagtctgaca ggcaactagg ccttgccgaa ggcgccacgg cgaactccgc 29640
tccgcccgac cccagggctc ggactcgggc taagacccgg aagacggcga actccgctcc 29700
gcccgacccc agggctcgga ctcgggctaa gacccggaag acggcgaact ccgctccgcc 29760
cgaccccagg gctcggactc gggctaagac ccggaagacg gcgaactccg ctccgcccga 29820
ccccagggct cggactcggg ctaagacccg gaagacggcg aactccgctc cgcccgaccc 29880
cagggctcgg actcgggcta agacccggaa gacggcgaac tccgctccgc ccgaccccag 29940
ggctcagact caggctaaga cccggaagac gacgaaactc cgcctcgccc gaccccaggg 30000
ctcggactcc gccctggcct cggccggacg acttctgcct cgcccgaccc cctggctcgg 30060
gctcggccac ggcaactgaa ggcaagactc aacctcggct tcggaggaaa ccccacgtcg 30120
ccctgcctag agcacagacc gccacgtcaa taggaaacgt catcatcacc ctaccccgaa 30180
tcgactcggg tcacggagaa caagaccggc gtctcgtccg gccagctccg ctagaggggc 30240
aatgatggcg ctccacgagc tctatgacga cggcggcccc cagctctctt acggcagcag 30300
gacaacgtca gcagggactc gaccgctcca acagctgtcc ctccatcagg ctccgccgca 30360
ccaccgatag ccacgacatc acgccagcag gatgcccaga tctctccggc tgccacatcg 30420
tcatgtacct agggcactag ctctccctcc gctagacacg tagcactctg ctacatcccc 30480
attgtacacc tgggtcctct ccttacgact ataaaaggaa ggaccagggc cttctcagag 30540
aaggttggcc gcgcgggacc gaggacggga caggcgctct cttggggccg ctcgcttccc 30600
tcacccgcgt ggacgcttgt aaccccccta ctgcaagcgc acctgacctg ggcgcgggac 30660
gaacacgaag gccgcgggac ttccacctct ctcacgctcg gctccggccg cctcgcctct 30720
cccccctccg cgctcgccca cgcgctcgac ccatctgggc tggggcacgc agcacactca 30780
ctcgtcggct tagggacccc cctgtctcga aacgccgaca gttggcgcgc caggtagggg 30840
cacgctgcgt gctgacgaat agctccccgt caagctccag atgggcagtc tccagcaacc 30900
tctccggccc gggacggtgc ttcgtttcgg ggctctcgag ttcatgtcct tcgacggcag 30960
ctacgacatg atacttcttc caccgccgtg cgaccacgac aatggcggcc gacaacccgc 31020
ccgccggcgg cggaatcgac gacgtctacc ccgcgtggtg gaaaagcaac attcgggctc 31080
gctccgttct ctcccccgcc aacggaggag gaggcggggc cgtcaaggcc agacgggaga 31140
ccgcgcttcg ccggccgtcg agcgaatcga cgcccccgac gccccgacgg aaggcacgcc 31200
ggacaccgac ctcgcgttca agacggaggc aagcgccgtc cccccgcggc acgacgaccc 31260
cgagcaagaa gacgacgccg gcgcgctcgc ggaaagcctg caggacgtcg ccctcgaacc 31320
agagatgacg gcgcaaccag tccccgatgt gactacgtcg ctcctcgtcg accaaaaggt 31380
aacgactaac tcccatcttg cgtcatttcg actcggcctc aacccgccaa acgacctcgt 31440
tttggcgggc gccctcattg aggcgagtgc aaccccactg aggttctgta tgcgatcgcc 31500
ttgggaccga ctgacggacg tctcgaccta cgggccctct gggtccgagg aagatgacga 31560
ccccagcatc ggttgggatt tctccggact tggcaacccc agtgtcgtgc cggacttcat 31620
ggccgcatgt gactactgtc tgtccgactg ttccgatgca agccgcagcc ttggcgacga 31680
gagctgcggc ccaagccgcg aatgtttcca catcgagcta gggaatccca ccgaaggcaa 31740
ccatcttggc atgccggagg atggtgatct ccctaggccg gtgcctcgcg ccgacatccc 31800
acgggagcta gctgtggtcc ccgctccggc ggggggttac gacccacaac tcgagcaagt 31860
ccgcgaggcg caggccaggc tcaacgaggg aacgggagcg cttgagccga tccgtcggga 31920
cgtcggacag gcatgggtgg gccaacccct ggccggagaa atacgtcatc tgccccaagg 31980
tctccagcac cgcgtcgcca acgacatcag gatcaggccg ccgcccgcat ccagcggggt 32040
cggtcagaac ctggcaaccg cagcaatgct catccgcgcg atgccggagc cgtcaaccac 32100
cgagggtcgg cggatccagg gagaactcaa gaatctcctg gaaggcgccg cggcccggcg 32160
ggccgagagc actgcatccc gaaggcaagg atatccctcg gaacctcatg ccgcgacttc 32220
ccgattcatg cgggaagcct cggtctacac cgggcgcacg cgcaacaccg cgcctgcggc 32280
cccgggccac ctcggcaacg agcaccatcg acacgaccgt cgggctcacc tcgacgaaag 32340
ggtgcgccga ggctatcacc ccaggcgtgg gggacgttac gacagcgggg aggatcggag 32400
tccttcgccc gaaccacccg gtccgcaggc tttcagtcgg gccatccgac gggcgccatt 32460
cccgacccgg ttccgacccc cgactactat cgtaaagtac tcgggggaaa cgagaccgga 32520
gctgtggctc gcggactacc gccttgcctg ccaactgggt ggaacggacg acgacaacct 32580
catcatccgc aacctccccc tgttcctctc cgacactgct cgtgcctggt tggagcacct 32640
gcctccgggg cagatttcca actgggacga cttggtccaa gccttcgctg gcaatttcca 32700
gggcacatac gtgcgccccg ggaattcctg ggaccttcga agctgccggc aacagccggg 32760
ggagtcgctc cgggactaca tccagcgatt ctcgaagcag cacaccgagc tgcccaacat 32820
caccgactcg gatgtcatcg gcgcgttcct cgccggcacc acttgccgcg acctggtgag 32880
caagctgggt cgcaaaaccc ccaccagggc cagcgagctg atggacatcg ccaccaagtt 32940
cgcctccggc caggaggcgg tcgaggctat cttccgaaag gacaagcagc cccagggccg 33000
cccgtcggaa gaagctcccg agacgtctgc tccgcgcggc gccaagaaga aaggcaagaa 33060
gaagtcgcaa tcgaaacgcg acgccgccga cgcggacctt gtcgccgccg ccgagtataa 33120
gaaccctcgg aagcccccca gaggtgcaaa cctcttcgac aagatgctca aggagccgtg 33180
cccctaccat cagaggcccg tcaagcacac cctcgaggag tgcgttatgc ttcggcgtca 33240
tttccacagg gccgggccac ccgccgaggg tggcagggcc cacgacgaca acaagaacga 33300
agaataccca gcaggggggt tccccgaggt ccgcgactgc ttcatgatct acggagggca 33360
tgcggcgaat gcctcggctc ggcaccgcaa gcaagagcgc cgggaggtct gctcgttgaa 33420
ggtggcggcg ccagtctacc tagactggtc cgacaagccc atcactttcg accgagccga 33480
ccaccccgac catgtgccga gcccggggaa atacccgctc gtcgtcgacc ccgttgtcgg 33540
cgatgtcagg ctcaccaagg tcctgatgga cgggggcagc tgcctcaaca tcatctacgc 33600
cgagaccctc aagctcctgc gcgtcgatcc gtccaccgtc cgagcaggcg ctgcgccctt 33660
ccacgggatc atccctggga agcgcgtcca gcccctcggg cgactcgacc tcccagtctg 33720
cttcgggaca ccctccaact tccgaaggaa gaccctgacg ttcgaagtgg tcgggttccg 33780
aggaacctac cacgccgtgt tagggaggcc atgctacgcg aagttcatgg ccgtccccaa 33840
ctacacctac ctgaagctca agatgccggg ccccaacggg gtcatcaccg tcggccccac 33900
gtacaaacac gcgttcgaat gcgacgtgga gtgcgtggag tacgccgagg ccctcgccga 33960
gtccgaggcc ctcatcgccg acctggagaa cctctccaag gaggtcccag acgtgaagcg 34020
ccatgccggc aacttcgagc cagcggagac ggtcaaggcc gtccccctcg accccagcgg 34080
cgacaccacc aagcagatcc ggatcggttc cgggctcgac cccaaatagg aagcagtgct 34140
cgtcgacttt ctccgcgcaa acgccgacgt ctttgcgtgg agtccctcgg acatgcccgg 34200
cataccgagg gatgtcgccg agcactcgct ggatattcgg gccggagccc gacccgtcag 34260
acagcctctg cgccgattcg acgaggagaa gcgcagagcg attggcgaag agatccacaa 34320
gctaatggcg gcagggttca tcaaagaggt attccatccc aaatggcttg ccaaccctgt 34380
gcttgtgagg aagaaagggg ggaaatggcg gatgtgtgta gactacactg gtctcaacaa 34440
agcatgtccg aaggttccct accctctgcc tcgcatcgac caaatcgtgg attccactgc 34500
tgggtgcgaa accctgtcct tcctcgatgc ctactcgggg tatcaccaga tccggatgaa 34560
agagtccgac cagctcgcga cctctttcat cacgccgttc ggcatgtact gctacgtcac 34620
catgccgttc ggcctgagga atgcaggcgc gacgtaccag cggtgcatga accatgtgtt 34680
cggcgaacac atcggtcgca cagtcgaggc ctacgtcgat gacatcgtag tcaagacacg 34740
gaaggctccc aacctcctct ccgaccttga agtgacattc cggtgtctca aggcgaaagg 34800
agtcaagctt aatcctgaga agtgtgtctt cggggtgccc cgaggcatgc tcctagggtt 34860
catcgtctct gagcgaggca tcgaggccaa cccggagaag atcgcggcca tcaccagcat 34920
ggggcccatc aaggacttaa aaggggtaca gagggtcatg ggatgcctcg cggccctgag 34980
ccgcttcatc tcacgcctcg gcgaaagagg tctgcccctg taccgccttt taaggaaagc 35040
cgagtgtttc gtttggaccc ctgaggccga ggaagccctc ggcaacctaa aggcgctcct 35100
tacaaaggcg ccagtcttgg tgccgccggc ggacggagaa accctcttgg tctacgtcgc 35160
cgcgaccact caggtggtta gcgccgcgat tgtggtcgaa aggcaggagg aagggcatac 35220
attgcccgtt cagaggccgg tttacttcat cagcgaagtg ctgtccgaga ctaagatccg 35280
ctacccacaa gttcaaaagc tgctgtatgc tgtgatcctg acgaggcgga agctacgaca 35340
ctacttcgag tcccatccgg tgactgtggt gtcatccttc cccctggggg agatcatcca 35400
gtgccgagag gcctcgggca ggatcgcaaa gtgggcagtg gagatcatgg gcgaaacgat 35460
ctcgttcgcc cctcggaagg ccatcaagtc ccaagtgttg gcggatttcg tggctgaatg 35520
ggtcgacacc caactaccaa cgactccgat ccaaccggag ctctggacca tgtttttcga 35580
cgggtcgctg atgaagacgg gggccggtgc gggcctgctc ttcatctcgc ccctcggaaa 35640
gcacttgcgc tacgtgctgc gcctccactt cccggcgtcc aacaatgtgg ccgagtacga 35700
agctctggtc aacggattgc ggatcgccat cgagctaggg gtcagacgcc tcgacgcccg 35760
tggtgattcg cagctcgtca tcgaccaagt catgaagaac tcccactgcc gcgacccgaa 35820
gatggaggcc tactgcgacg aggttcggcg cctggaagac aagttcttcg ggctcgagct 35880
caaccatatc gctcggcgct acaacgaaac cgcagacgag ctggcgaaga tagcctcggg 35940
gcgaacgaca gtccccccgg acgtcttctc ccgggatctg catcaaccct ccgtcaagct 36000
cgacgacgcg cccgagcccg aggtatcctc ggctcagccc gaggtaccct cggctcagcc 36060
cgaggtaccc tcggttcagc ccgaggcacc ctcggcccag cccgaggtac tctcggcccc 36120
cgagggcagg gcattgaacg tcgaggaagg gcagagcggg gccacgccag accaggattg 36180
gcaggccccg tacctgcaat atctccgtcg aggagagcta cccctcgacc aagtcgaggc 36240
tcggcgggta gcgcgacgcg ccaagtcatt cgtcttgctg ggcgacgaag aggagctcta 36300
ccatcgcagc ccctcgggca tcctccagcg atgcatctcc atcgccgaag gtcgggaact 36360
gctgcaagaa gtacactcgg gggcttgcgg ccaccacgca gcaccccgag cccttgttgg 36420
aaatgctttc cggcaaggct tctactggcc aacggcggtg gctgacgcca ctagaattgt 36480
ccgcacctgc gaagggtgcc aattctatgc gaagcggaca cacctgcccg ctcaggctct 36540
gcagacaata cccatcacct ggcccttcgc tgtatggggt ctggacctcg tcggtccctt 36600
gcaaaaggcg cccgggggct acacgcacct gctggtcgcc atcgacaaat tctccaagtg 36660
gatcgaggtc cgacctctga acagcatcag gtccgagcag gcggtggcat tcttcaccaa 36720
catcatccat cgcttcgggg tcccgaactc catcatcacc gacaacggca cccagttcac 36780
cggcaaaaaa ttcttggatt tttgcgagga tcatcatatc cgggtggact gggccgccgt 36840
ggctcatccc atgtcgaatg ggcaagtaga gcgtgccaac ggcatgattc tacaagggct 36900
caagcctcgg atctacaacg acctcaacaa gttcggcagg cgatggatga aggaactccc 36960
ctcggtggtc tggagcctaa ggacgacgcc gagtcgtgcc acgggcttca cgccgttttt 37020
cctggtctat ggggctgaag ctatcctgcc cactgacctg gaatacggct ccccaagggc 37080
gagggcctac accgagcaaa gcaaccaagc cagccgagag gaatcgctgg accagttgga 37140
ggaagctcgg gacagggcct tactacactc ggcgcggtac caacagtccc tgcgacgtta 37200
ccacgcccga ggggtccggt cccgagaact ccaggtgggc gacctggtgc ttcggctgcg 37260
acaagacgcc cgagggaggc acaagctcac gcccccctgg aaagggccgt tcgtcatcgc 37320
caaagttctg aagcccggaa catacaagct ggccaacaat caaggcgaga tctacggcaa 37380
cgcttggaac atcaaacagc tacgtcgctt ctacccttaa gatgttttca agttgttcac 37440
atacctcgca cctacgcaaa gtttagttgt caaggaaggg tcggcctagc ctcggcaaag 37500
cccgaccctc cctcgggggc taaaaggggg gagaccccct ctgcgtcgaa ttttttcctc 37560
gaaaaaggac ctctttttag caggatttct tccgtgcttc ttgactactt tggaaagcgg 37620
atcctggaaa cgacgaggta cacgtaagca gccaaggctg accaagccga gggactccta 37680
cgcctccggg atacggatac ctcactcgtc cccttctgcg ataagtaact tgcgctcgga 37740
taaagcgact ccgtggaccg aacgagtcat cacgttcgga agctctcctg ccgaagcagt 37800
ccttcaagct ttctcgacta aatcggggac agggcctcat ggacgggtga aagtacgcgt 37860
aagcggcaag gccgaccgag ccgagggatt cccacgcctc tgggatacgg atacctcact 37920
cgtcccttcc gcgaaaagca actctcgctc acacaaacat ccctattacc gacagagtcc 37980
agatgctcga aacaagagga aaaaaggacg cagcttcgca agcgcggcga gggcgtgttc 38040
ttctggcctc ggcggccgca gaaagcgcac gctacaagat gatctgatcc tgcaggctcg 38100
ggtcttcacg ccgaagggag ccgtagcacc ctcggcatcg acgacgtcta cagcaaagcc 38160
cgacccagcc tcgggcggcg ccgaggtcca ggggctcctc caggaatccg gcccgagcag 38220
gcggctcaac cggttacccc tggggcctcg ggcaaccggc ttccaagggc gctagcccga 38280
tccaaggcct cgactgaccg acttgggcgt cggcaccgct gacgggcgac acggctaggc 38340
tccggccaac caggttcccc attctcgagc caactccgcc tctgttcaca ctgatatcgc 38400
tacccccggc ctcgatccac caaagggcgg ccgaggggtc ccttcaacta agctagaaga 38460
gcctcacgta acaaggccga acgggccgag ggattcctac gcctccggga tacggatacc 38520
tcacccgtca ccttgacacg gggcaactca tgcttggtaa agcggtttag ataataaaac 38580
aggcgagact tagtgctcgg aaatgaggaa aaaacacggc tccgtgccaa aattacatac 38640
atgttcaggc ctcgacagcc acaatgaacg aactcactgg cattcgaagt gccattacaa 38700
acggaactcc ggttccccct ccgcaggtac gaacaacccc actccgaggg ggaaggcctg 38760
cggagcaacg gaagaccgac gaacggcgcg ccgtcacctg ctccagcagt ggcgacgacg 38820
gcgacttctg ctccgggggg ccgaacagcg gcaacgctga cctcagggtg gatgccgctg 38880
tcaggaggcc cccgcccgtg ccaaaactcg tgaggcaagg acgggcagaa ggccgtagaa 38940
gatggaggtc agcccgtggc cggtcccggc cgccgcgccg gcggaagaac ctcttccggc 39000
tgccgtggca gacgccgacg ccgcaagggg ccccgaagcc actcgcggct gaagaacagg 39060
cacgctgcag ctgccggacg ccacgggcaa tgcccgcttc tccccccatc actgagtgaa 39120
ggagcgggcc accgcccacg caggggctga ccccaactcg gcactctccc ctccccagcc 39180
ttggtgatga aaatccttga ggctgaggaa ggggcagagg ccacagcccg gctcgctttc 39240
ccccaccatc aagctggagg tcgccatctc gggtgaccgc cggtgaaggg gtgcgaccgg 39300
gctgcgtggt gaaaatcctt gaagccgaac gatggctgag aggtaccaac tcccatggag 39360
ttgcgttcct ccaacgagga ggcggaaagg cggcggatat cccccatccg ggggcttgga 39420
agacgggaag acccggcgct taagggagga agaagacatg gtcgccttac gaaaggagcc 39480
tccctccttt taaaggcaac tcccctacgt gcgcccccag gcgccgcggg ccgagtcttc 39540
tccaacacgc tccaaggccc tcccctgcga ctcgggggct gggtcccgca tgtcatgcaa 39600
gccggctcag ggcagaagaa gccaaaccgc cgcgcatggt gcgcacgacc gtccagcggt 39660
tacaggcgac cccccatttc cgcccagacc aacaggcaga aggggcgagc agccatgcag 39720
gcggcatgca accgcgccag atggacgcgc ttctccaact tctgacacgc cagcctgggg 39780
cccaggccca cgcgtcgagc aactggcacg ccagttgctg catgcaagca accgcaccgc 39840
cacttgtgcc accgtcgcgc ctcttcggtt gcgaagccta tgccacgact cgaggcgacc 39900
caacagcgcc agactggcgc gtcggtcaaa gcgaccgaaa gtgggccggc agtaatagcg 39960
gtggcaggcg ggcgggcgca gcggtcacgt cgtcagccag gctcacgtcc catcctgaga 40020
cagcaagaga gcctcctctc acggcgtgaa gacggtgcac ccgtgacccg ttcctcgaac 40080
ggatcacccg cgcgcaacgg ccgccccgcc aaccactcgc cccgtcgcat taactccgcg 40140
gcgggacacg cggcgcttct ggcaggagga gcgcgcgacg cttcacctcc gccttaataa 40200
ccgcgtcaga aaaggtacgc cacgtcgtct gatttcgtat ccttttccgt tttcctcttt 40260
ctctatctct tgcatcaggg accggggaag ggggataccc cgagagggat ccttctccgc 40320
gaaggaaccg ggctccgcgc cccccattac tgatcagggg ttcgaaggct ggccccccga 40380
gggttcaaca gccgcctcag atcgcgtggg cccgacaccc actactggtc aggggttcga 40440
aggccggccc tccgaagggc tccacggccg cctcaggcta ctcgggctcc gcgcccatta 40500
ctgatcaggg gttcgaaggc tggcccccga agggttcaca gtcgcctcag acaccgagcg 40560
agggatgacc aggggtacgt tcgatacata accgaggctc gggctgcgct cccgaggtac 40620
cctaggacat atccgagacc agcgggaacg atcttgtaac ggaatcccat cggagggagg 40680
catcgagccc tcggaccccg tcgccagggg accgggtccg gcaagtcacc cgcatgtact 40740
tttgggcgtg cctctgggcc cctagccgac ccccaacgaa cggggcacgg acgtccactc 40800
ggattacccg cttgcagctc accggagaca ccatgttcgg tgcccatcga gggtaacatg 40860
gcgcactccc ccctcctcct tgcggaaagg cgacgtaggg gcgtatgtaa aaagccgagt 40920
ctgtccctga tcgtcctctc gccctgtgca gaggctcggg ggctgctctc gcaaaaaccg 40980
gctccggcca aatcgttgac agcgtcaaca taccagcccg agagcttggg ccccgaccgt 41040
gcacccgggc tacggccagt tcgcatgagg gaacgaccag accagccgaa gcgctaagcg 41100
aagtattaag acctcgaagg agtgtaacca ctcctccgag gcctcggggg ctacacccgg 41160
cgggtgcgct cgcgcgcacc caccggaacg aaatgcaacc gagaaaggct ggtccccttg 41220
caaaaaagtg cgacaaaagc ctccaagcga gtgctaacac tcccttcgag gctcgggggc 41280
tactgtcggg gaccataatt aggggtaccc tcaagacgcc taattctcag ctggtaaccc 41340
ccatcagcat aaagctgcaa aggcctgatg ggcacgatta agtcagggat cagtccacac 41400
gagtgactcg atcgcgcttc acccgagcct agcctcggcc gaaggcagcc gacctcgaga 41460
gacttccgtc tcgcctgagg cccccctttt tatggcggac acatcaccgg cttgcccaag 41520
gccttggctt cgctcagaag caaccttgac taaatcacca caccgactga ccaaattgca 41580
ggggcattta acgcaaaggt ggcctgacac ctctatcctg acacgcgccc ccggcagagc 41640
cgaggtgacc gccgtcactc caccgctcca ctggccagtc tgacagaagg acagcgccgc 41700
ctgcgccact ccgactgcag tgccactcga cagagtgagt ctgacaggca actaggcctt 41760
gccgaaggcg ccacggcgaa ctccgctccg cccgacccca gggctcggac tcgggctaag 41820
acccggaaga cggcgaactc cgctccgccc gaccccaggg ctcggactcg ggctaagacc 41880
cggaagacgg cgaactccgc tccgcccgac cccagggctc ggactcgggc taagacccgg 41940
aagacggcga actccgctcc gcccgacccc agggctcgga ctcgggctaa gacccggaag 42000
acggcgaact ccgctccgcc cgaccccagg gctcggactc gggctaagac ccggaagacg 42060
gcgaactccg ctccgcccga ccccagggct cagactcagg ctaagacccg gaagacgacg 42120
aaactccgcc tcgcccgacc ccagggctcg gactccgccc tggcctcggc cggacgactt 42180
ccgcctcgcc cgaccccctg gctcgggctc ggccacagca actgaaggca agactcaacc 42240
tcggcttcgg aggaaacccc acgtcgccct gcctagagca cagaccgcca cgtcaacagg 42300
aaacgtcatc atcaccctac cccgaatcga ctcgggtcac ggagaacaag accggcgtct 42360
cgtccggcca gctccgccag aggggcaatg atggcgctcc acgagctcta tgacgacggc 42420
ggcccccagc tctcttacgg cagcaggaca acgtcagcag ggactcgacc gctccaacag 42480
ctgtccctcc atcaggctcc gccgcaccac cgatagccac gacatcacgc cagcaggatg 42540
cccagatctc tccggctgcc acatcggcat gtacctaggg cactagctct ccctccgcta 42600
gacacgtagc actctgctac atccccattg tacacctggg tcctctcctt acgactataa 42660
aaggaaggac cagggtcttc tcagagaagg ttggccgcgc gggaccgagg acgggacagg 42720
cgctctcttg gggccgctcg cttccctcac ccgcgtggac gcttgtaacc cccctactgc 42780
aagcgcacct gacctgggcg cgggacgaac acgaaggccg cgggacttcc acctctctca 42840
cgctcggctc cggccgcctc gcctctcccc cctccgcgct cgcccacgcg ctcgacccat 42900
ctgggctggg gcacgcagca cactcactcg tcggcttagg gaccccctgt ctcgaaacgc 42960
cgacaaaaac cctcaccaca ttttcctcaa ccacatgatg gagattgggg ctactagata 43020
ctatgcctgg tggtagactg gtagctgatg tctttggacc agtagttggt gctagatttg 43080
tgaactctac caaggtgaga aacggagatg gaggctgccc tgctgagcgg gttcatcaaa 43140
accatcctgc caaggctctt ctcactggta caagggagat acaagctgca caagggcctc 43200
aagagcgaca tcaaatcgct ggagaaagag ctccatatga tcgctgttac aatcgatgaa 43260
caaatctcgc tggggaggaa ggatcaggga gctgtgctga gcctctcaat tgatgagctg 43320
catgaactgg ctcaccaaat cgaggactcc atagatcgct tcttgtacca tgtgaccagg 43380
gagcagcaag catccttttt tcgtcggact gtacggtcgc cgaagactct gttgtcacgt 43440
cagcggctgg ctgccgaggt tcagttcctg aagaagatac cggaggaggc gcaccagcga 43500
gagaagaggt acagggtctt cgccggcctt tcttcctcta cccggcacac tgaatcgtct 43560
tcctgttcgt ctgtatctga tccgcacaca cttaaggccg acgtcgtcgg catcgacggt 43620
cccagggacg agcttgtgca gcagttaacc gaagaggcag agggcctaac aaagcagctc 43680
aaggtgatct ccatcgtcgg gatccatggc tccggcaaga ccgtccttgc cagagaggta 43740
tacgagagcg acgtcggccg gcagttcagt ctccgggcat gggtttctgc tactgacaga 43800
ggtccgagag aggtgctcat ggagatcctc cgaaattttg gtaggccagt ggtggatagc 43860
tctagtattg accagcttac ggtagatctc aggaaacact tgggtgagaa aaggtgaaaa 43920
aaacctcttc tttatgttat ttattattta tgaagtttct tcaactacgg gttttcatgt 43980
tcaaattgcc tctctgaact tcgaaaacgt ttaataccaa ttgaattgag gatcttagct 44040
ttggaaaagc ggtagtgttt tgacgttttg catacatttc tcaccgttat tttattcatt 44100
tataatttag agtttaagca gtatattcat tttgaaattt atgagatttc tgtctgcacg 44160
cttacttcca tgcccaaaac atgtccgatt gagaacagaa ggtaattttg tttgatcttt 44220
gagatcagac acactgattg agtagtaaca ggaaacaagt gctcaccaat caccaagtca 44280
cttacaaaga atttcatgct tacaaaacac actgattgtt aaggatagag actatgtttg 44340
atctgcatag tttgaatttt gattatgtca tcgtcgattg ttatcattaa cttttgttgg 44400
aaatttctct tgtagctatt tcattgtaat cgatggcatg caaacagatc agtggagcac 44460
cattgaaact gccttcccag aaaacaatgt tgttagcagc agagtaattg ttacaacaac 44520
aatccggtca gtagctaatt cttgcagctc ttctaacggt tatgtgcaca aaatgaaaag 44580
acttagtgac gaacactcag agcaattgtt tatcaagaaa gcttgcccaa caaaatattc 44640
aggttatact cgaccggaat caaaagaagt tctgaagaaa tgtgatggtc aaccacttgc 44700
tcttgttact atgggccaat tcttgaggaa aaatggttgg cccacaggac ccaactgcga 44760
aaatgtgtgt agagatctta gacgacatct ggagcaggat gatacattgg agagaatgcg 44820
aagggtgctt atccacagct tatctagtct tcctagccat gttcccaaag cctgcctttt 44880
gtattttggt atgtttccat gtgatcatcc cataaagagg aagagcctga tgaggcgatg 44940
gttagcagag ggatttgtac aaacacagcc ttcatctagt gaaaacttca acaccctcat 45000
agaccggaat attattgagc ccatcggcat atgtaacgat gatcaggtaa agacatgcaa 45060
aacatatggc atgatgcacg agttcatttt gttaatgtcc acctcccatg acttcattac 45120
cctgctttgt aataataaag ttgaacacaa atatgtgcgt cggctttctc tccatcatca 45180
tagtgctaca agtggcagtt tttcggtcat cgacttatct cttgttagat ctctgatggt 45240
ttttggggag gctggcaaaa ctattttgag tttccgaaag tacgagctat tgagagtctt 45300
ggatcttgaa caatgtaccg acttggaaga tgatcacctc aaagacatat gcaacctttt 45360
tcttatgaaa tatctaagcc tcggagaaac tattagaagt cttccaaagg agatagaaaa 45420
actgaagctc ttggagacac ttgacttgag gagaacaaag gtgaaaacac tacctataga 45480
ggtcctcctg ctcccctgtt tactccatct gtttgggaag ttccaatttt ctgataaaat 45540
caagataaca agtgacatgc agaagttttt cttaactgga cagagtaact tagagacact 45600
ttcaggattt atcacagatg ggtctcaagg attgccacag atgatgaatt acatgaattt 45660
aagaaagctt aagatatggt ttgagaggag taagagaagc accaacttca ccgatcttgt 45720
gaatgctgtc caaaagttca tccatgatga caaagagagc aatgatccac gttctctatc 45780
acttcatttc gatgacggca ctgaaaacat cctgaactct ttgaaggctc cttgttacct 45840
taggtcattg aagttaaaag ggaatttgct ggaacttccc cagtttgtca tatcaatgcg 45900
gggtctccgg gagatatgcc tttcatcaac aaaattgaca tcgggcctcc ttgcaacact 45960
cgctaacttg aaaggcttgc agcatctcaa gctgattgca gatgtccttg aagattttat 46020
cattgaaggt caggcattcc tggggctgct acacctatgt tttgtcctag aacgtgccac 46080
cttaccaata attgaaggag gagctttgcc gtacctcatc tcacttaagc taatctgcaa 46140
agatctagtt ggcctcggtg acatcaaaat caaccgcctc aaatgtctta aggaagtcag 46200
tctagatcat agagtcgctt cggaaacaag agaaatctgg gaaaaagctg ccgagaagca 46260
tccaaaccgg ccgaaagtat tgttggtcaa ctcatctgat gaaagcgaaa ttaaggctgt 46320
agactgttct gttgcttcaa gaccagctgt gagtgaggct aatggaactt ctcccatgtc 46380
agaggttgat gtacgagagg atgacattca gatgatactt aaccaggggc tctctgccgc 46440
tgctgagaaa cagatgaatt gtgcagttca gccaagttca aaagctgaac tgaactctga 46500
tttcaataat attagtttcc cagaggttgc gcttggttta accgagctgt gaattgcttg 46560
gaattgaaat gtgtcttcat acacctattg atccttgatt gtccatggtc agtttcgttg 46620
cacttgcagc atattactat gaggctagta tcatgtaaat tacaaatctt ttgttgttaa 46680
ggccataaat tgcatattat agcacaacaa gctggtatgt ctcaacaatg gcattaattt 46740
tttttctgct tgaatctaca aatttcatca ttattttgca atttcgcttt tatacagata 46800
tggtgatgcc atgtcatttt gactttgcag catatatgca agcaacggtt tgagttgctg 46860
gagttgctag aatattgata caacttcagt ttactcgaag gctacaggga tctcataact 46920
aggatggttg aagataattt gcgattgttt ccttcagtgt cactgaaaag acttttgtaa 46980
caataaagca tacctttgct tcctactttt ttgaagttac ttcagatgct aagttcgcag 47040
ttgggcctgg actttatcat gtttatccag ctgtttattt gtttcatgta caataatacc 47100
ggtgattgct gttgttatat aatctatatt tatactatag ttaaagtatc agtttcaacg 47160
gttgtcccgc gccatctttt tacaaataat ccatcacaaa tatttcaaat taacccgatg 47220
cacgcctata gatggccaaa cggcggtccg gcacgggcca gatgccttcg ggccacaact 47280
ctggcccagg cacgtcatgc cgggtcagct cattagcccg ttcgattaaa tcagcgtaaa 47340
atgttaaaaa acagtgtaag agttggagtt tgaacccatg ccctgattaa agaagggcaa 47400
aagacacttg gtgaagctat ctaaccaata gaacatcatg ctcaaatatt ttaatattga 47460
atataaattg tatatatgta tatacatttt tttataaaat ttaaaaaatt ataatcgtgt 47520
cgggctgtgc cagcactacg gactgaggct acagcccaag cacggcacga cgttcttggc 47580
tcttgcaagc attagattgt ttctgagact acattggcgc aatggactcg atggtgtttg 47640
aggttgctga attggatgaa gcaacaatga tttgtcacac taacagtaaa atgaaaggtt 47700
atttgttatt tttaaacgtt agttattgct acgaagtagc ataatttata tgaagtacat 47760
ccagttttta ttgatgcctg actttaacaa tcacttcata ttttgatata tcttttttat 47820
aagtttgagt tcagtgactt attttagaaa tttgagctca caaactttct cttatttggt 47880
ctctgtatgg tggaattatg tcattttata atttttgttc gttcagccag tcgttgtgaa 47940
ctttcttcta actgctcact tcattggccg tattgtacca agacatattg gatgtagtaa 48000
accataacat cagatagtta aatcaaaaaa atattatacg gagagcggag acaataaata 48060
aaaaatcttg aaattttttg gtggatagtt tatataggta ttgttgtaag ccgtcgcaac 48120
gcacgtgtaa ccgactagta ctaagtgaat tccccacttg tgggaattgt gagattgttt 48180
ttatatgaac gaatattgta ggtaaatgag taacataata ttccttttgt taacaccttg 48240
atctggtacg tcaaaaccac gtatgtacca tatgttttaa cttttgtatc tggtagaatg 48300
gactgaagta aagaatctca tccatcgact gctgctaata tatgcagctt cccagatcag 48360
aggtcccaaa catgtcacca cttaccaatt aaatctctta tttacttggc cttcccatga 48420
aactagcaaa agttgctgtc tccacaaact gcaggtcaat tcgtttcttt agcgccttat 48480
ttcagaaacc gtggtagcat tgacatttta ctcatctgga tagtttcggc ttgaatacgt 48540
agcgtcttgt acatttattc tctcacagta acagctaact cctgtgcaaa gatgcggctt 48600
attccattgg agaatagcgg actttttgtt ttatttagtt tcagctctct ggttgcaact 48660
tgcaattagc cactctgccc ttttgcgtta cctacattct atctagcaag gcagccaatg 48720
tttctcattg ccaggtcact tgtttttgaa ggctgtgcgg aagaaacatt tctacaaaca 48780
aacaattaga actgacatta ccgaagaaac agttaagtca aaagcttgtt ggttggatnn 48840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnngt tcnttcttgc gttccgttgn 48900
ttnnnnnnnn gnnngnnggn aatnnnannn taaannagnn actnaatnnn aagnttatac 48960
cnntagttta atttgtttac cctcccagga atattgcacg cctcgatgta ggcctccact 49020
cagactttat ttgggtactt tagtattggg gtttttatag tggtgccctc ggttttgctg 49080
gtgtgctcat ttttatcctt ggttccgctt tattttgctc agttttgccc ttccagtgct 49140
atagaacaga agggcaaaag tgagcaaaaa aaaacacaac taaggataaa aatgagcaca 49200
ccagcaaaac cgagggcacc actataaaaa ccccaatact aaagtaccca aataaagtct 49260
gagtggaggc ctaaatagag gcttgctaat tattagacct ttataactac attaaataag 49320
ataaaatatc cactgaaatt agaaaattga gtgaggtctg tgcccccgct aagccgtcca 49380
atgagggttc gtccgtcttc caacctgatt aaataagata aaatatccac taaaattaga 49440
aaaattgagt gcggtctgtg cccccgctaa gccgcccaac ccaaccttga tgaatttcct 49500
ggttcacaca tatgtggtgt gattgaaggg ttacacgaaa aacctcacaa ccccgatggc 49560
ctgtcttcgc tgaagtgtca ttcagtggtg atcaggaaca aatcccatcc caaactcaag 49620
cagagaacat tacaagttaa cataactgaa gttgaaccag atggtggtca gaatgagaag 49680
gcctgcaaca gtcaatttgt tctgattcct tttgtgcagg ctgctacagg ttgttctcct 49740
gacgagaaaa gcagttctaa gccggttgaa ttcgtgcagg atgcatacaa cagaaccatg 49800
cagactgaac ctcattgtgg atggcaatat ttttttcaat ctctgatact agtaccaagt 49860
cagcatgttt tgtccatccc catggcaatg gcatagagat agaactttct ataaatagtc 49920
ttgaggatca ggggacaagt caatcttgtg aaatcctaag taatacggag tacaagtttg 49980
tctgaaatat cacatcgagc gattgtgtgt gcgcgcctac tagctcatga aagtcctggt 50040
actgaagttt tcatttttct caagtcataa attatgcagg atgttataac tccacagagg 50100
gttatggagg ggacaaatag agcaaaatgt ggatggaaac atagaacaca gcaggctgcg 50160
gaaaaggaaa cataatctgt tcatccgctg acacaaaagc aagaacctct atttgagtgg 50220
aacctacaac ccattgtcac cgttgctcta ttgggtcttc agaagaaatt ttgactagaa 50280
tgttctaggc ggatggcgac ggcgattagg catcgtttct ccttcatgaa 50330
<210>138
<211>507
<212>DNA
<213>人工序列
<220>
<223>MZA3434加工的共有序列
<400>138
gtcatgtccc ccctcattag aggcgctact ggacatgtgg aagctgccat gttcggctgc 60
aacgacgcca cccaggtgta caaggagctg caggaggcca tcaaatccta cccggacgcc 120
ttccaccgcg tcatcggctt cgacaacatc aagcagacgc agtgcgtcag cttcatcgcc 180
tacaagcccc cgggcagcga ctagaccgcg cccgccggcc gccccccgcc ggctagctag 240
ctagctagct cctgcgtgag ctagtagcta gctagtgcca tgcgtcgtct ctgtcgttcg 300
gttttgcttc ggggtcaccg tgtacccttt gcttgcttgg tttcttcttt ccttttttcc 360
tttttttttt cttcttttcc ccggccatgg ttcctttgct ttccagcagt tctctgctgg 420
atgtaatgta tccattgttg caagcatggc cttgcattgg ctacctctat acctgctaaa 480
aaactactgc aaatggtcat agctgtc 507
<210>139
<211>650
<212>DNA
<213>人工序列
<220>
<223>MZA2591加工的共有序列
<400>139
asggtaccaa ctaaaagggc ctggaatcat ggaagcccac aataaccagg agcgagctac 60
ctgcgaagcc acatctctcc ttcctcttca tcgatagtac tcatctccat attcaggtaa 120
ataacatcgt ctgcatgccg cgcgccccta atagcatctc gatcacattt ttgtgttctt 180
gacttctcct cggaagcctt cttgtttaac aaacttatat tagtcgttgg tcgatctttg 240
gacccacatg taaatcttgg ttcgcgtccg ccgtgcagtg cagaggcaca agctaagcca 300
tgagcaacgg tggtaaccgc agcaggggcg gcgcgaggtt cgagctgcag ctgcacctgt 360
cgccgccgcc gcccgtggct aggagggtgt aggtttactg cgtatgctac tgcagcgact 420
cgtcttcttc cccgagctcg tgcgtgtcgt ctgactgcat tccagggagc aattcgccga 480
ttgtaatcgg cgcctgcacg cggtgcatga tgtactgcat ggtgtccaag aatgacttcc 540
ccacctgcat caactgcaag cagccctgcc tcgtgtacct cctccactgc tcttggcccc 600
tgctgcagcg gcaccggcaa ggccaattaa aakgacttca acctttcgta 650
<210>140
<211>731
<212>DNA
<213>人工序列
<220>
<223>MZA11123加工的共有序列
<400>140
tcaaatcctg gggggaaacc ttccgggtgg gtcattgcaa aatgggcagt ttatgggctc 60
cttaatgatg gggggtcacg gttcgggggt tttttcggcc gggaccatgt ttcggtctct 120
tcttaatata ataccgggag gcagtttttc ctcctccccg gccgcgtttt ttagtgtaaa 180
tatgcaaatg taccatcttg attggcttct atgatctaca ttttagtgta ggctgcaagt 240
ccacgagctt tgaaaagtta cacaatctgg attatttgca agtcgtaaac acttatagga 300
ctcagtgact agattggacc agcctgttgc attcatgcaa ttgttaggct aattgtcatt 360
tcaccttcag tctacaatga aatggttaac atagtgcatg gatttcttcc attggtacat 420
caataataat atccaacagc gctaatgaga tgtacgtctt gtttccagat gttacagatc 480
caactgcaaa tggtgcagcg tggcgctgct gggccgccca gtaacgagaa tactgagcac 540
acagaagaat gactgaatct gtgaacagac acttctgcat cgtggtgtaa taataaggag 600
aatactgatg agcacacacg ctgaagaatc tgtaaatagg cggcgatgag gatgggacaa 660
aagaaagcca aggattggcg atacctgggc tggggaaact gtacgggtaa aaacttaata 720
agggggttta a 731
<210>141
<211>704
<212>DNA
<213>人工序列
<220>
<223>MZA15842加工的共有序列
<400>141
taaccacccg cctggctaat tgttccgacc atttttatag cctgcatggc ttacattgtc 60
ttcacgaggg tcaacaggat attcagattg cgcatttgga cttaaaacca gcaaatatat 120
tacttgacag tgacatggtt cctaaacttg ctgattttgg tatgtcaagg ctcttcagtc 180
tcgaacaagt ttatatcctt gcttccaagc ctatgggaac aatgtaagct cattaagttt 240
actgaatgtg ctttcttgat cttatatggc ttgcaacacc tttgaaactt atttggttta 300
aaagacacat ttaattttcc ttcattagta catgtgtcct gaagtataag gaaaccttag 360
ttcgttaact caaaagattt ctatttggct aagtttatag agaagagtat tagcatatac 420
catattaaaa agctagctat gaaaatatat ttcatagtgg gtttaatgat gatcatttga 480
tactccctct gccccaattt ataatccgtt taactttttt actctaagtt tgatcgactc 540
gtcttattca aaacttatgc gagaaaatgg aaaattcaaa gccatactta aagcatatta 600
tatgctaaat gacatcacag taaaaattaa taacaattat gattttttta ataggacgaa 660
ttggtcaaag ttagggtaaa aaagtcaaac aaattataaa ttgg 704
<210>142
<211>665
<212>DNA
<213>人工序列
<220>
<223>MZA1851加工的共有序列
<400>142
aaaaaggaaa tttttttttt taaaaaaaac ggaggctcta acagggctct gggtagtggc 60
ccaaactgtg ccaatatgga taatggaaga ttcttggggc agagtattaa gggaagttgt 120
ttttttcttc ttcttttggt tggtcttttt aagctgaatg gatgacatga ttgcctatgt 180
tatgtattgg gtaattttag ttgtcaaaat atatctttac agctatacgc tatcgctgtg 240
ctctgagcac ctcaaaacat ccaggtgatg acatctacac atggggttgg ggaggcgcca 300
atgggacttt tttcgaagag ggccattctt ccggtggaca gctggtgagt tgctttcaga 360
ccacaactgt ttccgcttga tggcaacaat gtgcggcatg cataatcccc acaggacacc 420
attcatatgg atatggtcga actgacttgc tacttgcagg gacatggaaa cgacgtagac 480
tattttgagc ctatgatggt tccctttggc acgaatgcca gagccgtcca tgtatcgtgt 540
ggcttcaatc atactggtgc aatttacgag tgctccgagg actttgactg acgtgagact 600
tgcagacagc agatccgcat gtcttggaga cttaggttag ttatcaaata tactcgctga 660
ggaaa 665
<210>143
<211>698
<212>DNA
<213>人工序列
<220>
<223>MZA8761加工的共有序列
<400>143
tgccaaaggg ggaacagtta aggctttata gaagggraag atttggttca ggtaactggg 60
ctcacatttg ttactatttg gaatcatagg ggttcaagca tttaaaaaga actgggatcc 120
ctaccaccag tttggagtgt tccacaaata cacttttatg tccttgggca tcgccaaggg 180
ctgctttttt ttctttgggt attcctgtta actcagatgc tcaaaaattg ggacaatatt 240
gacatgccct cttgattaga agtgtttgta gtttgtaatt tgcatcttat actttcatga 300
gtactcgagc cattgttgtg ttctcagttg atgtaatttc attatttaaa cttcttgttg 360
ggttgtctaa tggaatgcaa aaaaaatact tgaaaaatga cagatagcag atccagcagc 420
aattgaggca atggtagata aagtaattgc tgataatcca aagcaacttg agcagtaccg 480
tgctggaaaa actaagctac aaggattttt tgctggccag gtttgtcaat tgatgactag 540
cactgtttgt cccttcagct aggatgtatt atcagtgatc atatttgttt caattgatta 600
taggtgatga aagcatcgaa gggaaggcca acccagtttt gttgaataaa attcttgaaa 660
aattcttgga gagaagtttt tgctaaattt tatataaa 698
<210>144
<211>521
<212>DNA
<213>人工序列
<220>
<223>MZA11455加工的共有序列
<400>144
ttgaggcaat ttaaataagc attgcaggga aggcccagta caaacgttca accttctgac 60
tgacacatgt tgtggaacta accctcagca taggagcaag agaaaaatga ctgggaagag 120
aatgactggg aagagagatt gtttgcatgc acgtagcaga tatctgagag ctacagagga 180
aagctgggaa atagaagaag ctctaaaaca aggagtgttt ctggaaattc tttagttttc 240
aaaaaacact ttctgaaaat gtgtgtacaa gaaaattcca ggaaggtgaa attgcttcgt 300
tgactgcagt gggaagggga aagagagaag ctagaatctc atgtcgagta atccagtaca 360
atgtgttctt ttgtctggtc taaattcttg taacagctct tcctatgatg gaagaatcca 420
ttcaacaatt ccacctatga ttactggatt gagtatgttg aataggttgg ttgaggctat 480
ctagtaattt tatgactatt taatttattt ataactattt a 521
<210>145
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-01-F1
<400>145
ggtcttcgcc ggcctttc 18
<210>146
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-02-F1
<400>146
ggtcagtagc taattcttgc agctc 25
<210>147
<211>17
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-01-F-Taq
<400>147
tcttcgccgg cctttct 17
<210>148
<211>26
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-02-F-Taq
<400>148
cagagcaatt gtttatcaag aaagct 26
<210>149
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-01-R1
<400>149
gggaccgtcg atgccgac 18
<210>150
<211>29
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-02-R1
<400>150
tttcctcaag aattggccca tagtaacaa 29
<210>151
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-01-R-Taq
<400>151
gcggatcaga tacagacgaa ca 22
<210>152
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物C00060-02-R-Taq
<400>152
ggttgaccat cacatttctt caga 24
<210>153
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物FLP111RB
<400>153
caggttatac tcgaccggaa tcaaa 25
<210>154
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸探针C00060-01-PCA
<400>154
acggacgcgg aggaacagga agacgattca 30
<210>155
<211>29
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸探针C00060-02-PCA
<400>155
acggacgcgg agctcgaccg gaatcaaaa 29
<210>156
<211>26
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸探针C00060-01-P-Taq
<400>156
cctctacccg gcacactgaa tcgtct 26
<210>157
<211>32
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸探针C00060-02-P-Taq
<400>157
cccaacaaaa tattcaggtt atactcgacc gg 32
<210>158
<211>259
<212>DNA
<213>人工序列
<220>
<223>标记PHD0001-01的SNP序列
<400>158
tttagaaact cagctagtgc ttttggcaac caaaccccac agccaaacag ctgcatgtct 60
agaggtagag gagtagactc ctcacaccgg gtaagtctag ctgagtatta gtatactcag 120
ccttgcttgt ggcataattt ttacaggttc tctggaggaa atggttgctg gagtgacttg 180
gccgtccatc ttgccaccgg gttggactgt cgagtgggac cctgccttgg ctgaggagga 240
gcatgaggag tgatgggac 259
<210>159
<211>34
<212>DNA
<213>人工序列
<220>
<223>标记PHD0001-01的Invader寡核苷酸
<400>159
tgccacaagc aaggctgagt atactaatac tcat 34
<210>160
<211>26
<212>DNA
<213>人工序列
<220>
<223>标记PHD0001-01的Invader探针
<400>160
cgcgccgagg gctagactta cccggt 26
<210>161
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0001-01的正向寡核苷酸引物
<400>161
tagtgctttt ggcaaccaaa cc 22
<210>162
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0001-01的反向寡核苷酸引物
<400>162
ccatttcctc cagagaacct gt 22
<210>163
<211>259
<212>DNA
<213>人工序列
<220>
<223>标记PHD0002-01的SNP序列
<400>163
ggcttcccca tctctctatt tatttaccgt tagtttattt ccgctgcact tcgaacaatg 60
atggttactt ttgcaaaaac tccgaggatg atgatgatgg tgatgtaata atttaatact 120
ctgacatgta tggttttatg ctttattgta tttgctctgt gactcacctt cgagtgagat 180
tgtggtactt gatcctgtca gtggccgtgt cggactagat ccgagggatt gacgggttat 240
tcccaattaa gtgtggtct 259
<210>164
<211>36
<212>DNA
<213>人工序列
<220>
<223>标记PHD0002-01的Invader寡核苷酸
<400>164
ggccactgac aggatcaagt accacaatct cactct 36
<210>165
<211>27
<212>DNA
<213>人工序列
<220>
<223>标记PHD0002-01的Invader探针
<400>165
cgcgccgagg gaaggtgagt cacagag 27
<210>166
<211>23
<212>DNA
<213>人工序列
<220>
<223>标记PHD0002-01的正向寡核苷酸引物
<400>166
ggatgatgat gatggtgatg taa 23
<210>167
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0002-01的反向寡核苷酸引物
<400>167
ccgtcaatcc ctcggatcta gt 22
<210>168
<211>269
<212>DNA
<213>人工序列
<220>
<223>标记PHD0003-01的SNP序列
<400>168
acgctgctgc gacaaggccc tcgcccgcat ccccactcga ggggcgagga caagctatca 60
aagccgaaga gccggaggtc cgaccgcagg tggcgccgag aaaccttctc tggctgccac 120
cacctcagca ccgacgacgg cagccacctg cccaccaaca cccgccgggc cgtgaccaat 180
gtgctcggtt ggcactgttg ggtcatgcgc agggttgcct cgagtcgcgg caccggttcc 240
gcagtcgaga aggcgcggga ggaggcgcg 269
<210>169
<211>21
<212>DNA
<213>人工序列
<220>
<223>标记PHD0003-01的Invader寡核苷酸
<400>169
tggctgccgt cgtcggtgct t 21
<210>170
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0003-01的Invader探针
<400>170
cgcgccgagg gaggtggtgg cagc 24
<210>171
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0003-01的正向寡核苷酸引物
<400>171
ggacaagcta tcaaagccga ag 22
<210>172
<211>20
<212>DNA
<213>人工序列
<220>
<223>标记PHD0003-01的反向寡核苷酸引物
<400>172
caaccgagca cattggtcac 20
<210>173
<211>279
<212>DNA
<213>人工序列
<220>
<223>标记PHD0004-01的SNP序列
<400>173
cacgaacacc ccaaaccaca tgccgaggct gtagagtcgc cccagggttg aatcgaccga 60
ggcggtcatt tctcccctga ccacggcgaa gagcggcacg gtgcgcaact ggttttcctg 120
atagtgggca ccggcgtgaa attaggccgc caactcgcgc cccgatgcac cgacccacaa 180
tcgccaaggc ttctgctgcg caaacgagtt ccccgctgtg atggccgaag cacagcacag 240
caggtggacg gcagcggacc agtcgcggcg gcgcacaga 279
<210>174
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0004-01的Invader寡核苷酸
<400>174
tggcggccta atttcacgcc ggtt 24
<210>175
<211>28
<212>DNA
<213>人工序列
<220>
<223>标记PHD0004-01的Invader探针
<400>175
cgcgccgagg gcccactatc aggaaaac 28
<210>176
<211>21
<212>DNA
<213>人工序列
<220>
<223>标记PHD0004-01的正向寡核苷酸引物
<400>176
ggtcatttct cccctgacca c 21
<210>177
<211>19
<212>DNA
<213>人工序列
<220>
<223>标记PHD0004-01的反向寡核苷酸引物
<400>177
agcagaagcc ttggcgatt 19
<210>178
<211>300
<212>DNA
<213>人工序列
<220>
<223>标记PHD0005-01的SNP序列
<400>178
ttggggcgag cagggaggag aagaggaaca gcggcttcgg gtgttatagg cgcagggtaa 60
aggaggggac gaacaggtca cgctggcgcg atgccgcacc tatatgacga gtccgggctg 120
aggacgttaa ccgggcggcg ctagaatcct ggggcttcgg cagaggccgt tgcgggagta 180
gcggcgggca ggtgtgccgc cagcgctgta cgcggggtcg gggcacggag gttgttgcgc 240
taggggtccg cgatttccgt gaatcgggca cgagctcacc agcgccaccg gttttgcgca 300
<210>179
<211>23
<212>DNA
<213>人工序列
<220>
<223>标记PHD0005-01的Invader寡核苷酸
<400>179
cgctactccc gcaacggcct ctt 23
<210>180
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0005-01的Invader探针
<400>180
cgcgccgagg gccgaagccc ca 22
<210>181
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0005-01的正向寡核苷酸引物
<400>181
ctatatgacg agtccgggct ga 22
<210>182
<211>19
<212>DNA
<213>人工序列
<220>
<223>标记PHD0005-01的反向寡核苷酸引物
<400>182
acccctagcg caacaacct 19
<210>183
<211>290
<212>DNA
<213>人工序列
<220>
<223>标记PHD0006-01的SNP序列
<400>183
cgaagcggag gaaatgtagg gagggagaag aagaccactg ccggctgggt ggataagtta 60
gctgggtgac cctggaatgt ggggcccgcc tggcggcgac gcgaaggcca cacgagcgag 120
tgaggggcgt tgggtcgtgc ggtatcggaa aaaaaagaat gggccgaaag tgaggattcg 180
gcccaagtag tgttttattg tttttctttt tcttattttt tttcaaattc aactttaaat 240
tcccatttaa attcaaattt agtggtggat ctatcttcac attaatttcc 290
<210>184
<211>23
<212>DNA
<213>人工序列
<220>
<223>标记PHD0006-01的Invader寡核苷酸
<400>184
tcgctcgtgt ggccttcgcg tct 23
<210>185
<211>21
<212>DNA
<213>人工序列
<220>
<223>标记PHD0006-01的Invader探针
<400>185
cgcgccgagg gccgccaggc g 21
<210>186
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0006-01的正向寡核苷酸引物
<400>186
ggctgggtgg ataagttagc tg 22
<210>187
<211>21
<212>DNA
<213>人工序列
<220>
<223>标记PHD0006-01的反向寡核苷酸引物
<400>187
cactttcggc ccattctttt t 21
<210>188
<211>300
<212>DNA
<213>人工序列
<220>
<223>标记PHD0007-01的SNP序列
<400>188
caacttaaac atggcatggg tgaacttatt tattttcaat atttatttta ttaaaactag 60
tgctatgttt ctccaaatta gagtttaaat gctatgtgtc ccttaatata ttaatatatg 120
ggtactaaca catttatttt actatccaca aatgcacaat caagtaaaaa ctcagcatga 180
tgcataattt atttgagtgt cttctattaa ttatttattg tatagatgag gtgtccacat 240
gaaatggtaa atagggataa cccacacaca tgtaaaggaa tataatctct ccttttagat 300
<210>189
<211>58
<212>DNA
<213>人工序列
<220>
<223>标记PHD0007-01的Invader寡核苷酸
<400>189
tttctccaaa ttagagttta aatgctatgt gtcccttaat atattaatat atgggtat 58
<210>190
<211>36
<212>DNA
<213>人工序列
<220>
<223>标记PHD0007-01的Invader探针
<400>190
cgcgccgagg ctaacacatt tattttacta tccaca 36
<210>191
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0007-01的正向寡核苷酸引物
<400>191
ttaaacatgg catgggtgaa ct 22
<210>192
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0007-01的反向寡核苷酸引物
<400>192
tgcatcatgc tgagttttta cttg 24
<210>193
<211>274
<212>DNA
<213>人工序列
<220>
<223>标记PHD0008-01的SNP序列
<400>193
cggcggccac aagtcagtcg ccgaaaatta cctgttcttt tcggtgggcc tctgacggcc 60
gccgaaaata acaagtgccg aaaatagtat ttaaaaatac aaaaaataac agaaaattca 120
tacaataaca gaaaattcat acttgagtcc acaacataaa acttaagtcc atacaaacat 180
aaagtccaca aatagtccat acaaacataa agtccacaaa tagtccatta caaagcacaa 240
tgccgcacaa agctaactcc atcacatatc gggg 274
<210>194
<211>51
<212>DNA
<213>人工序列
<220>
<223>标记PHD0008-01的Invader寡核苷酸
<400>194
tttgtatgga ctatttgtgg actttatgtt tgtatggact taagttttat t 51
<210>195
<211>29
<212>DNA
<213>人工序列
<220>
<223>标记PHD0008-01的Invader探针
<400>195
cgcgccgagg gttgtggact caagtatga 29
<210>196
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0008-01的正向寡核苷酸引物
<400>196
cgaaaataac aagtgccgaa aa 22
<210>197
<211>23
<212>DNA
<213>人工序列
<220>
<223>标记PHD0008-01的反向寡核苷酸引物
<400>197
ggcattgtgc tttgtaatgg act 23
<210>198
<211>259
<212>DNA
<213>人工序列
<220>
<223>标记PHD0009-01的SNP序列
<400>198
cgttggagtt gtgtccacta ccttcagaag cgaaaaactc gttgacgaag tcgtgtaacg 60
ggtttagatt ctaaagaaaa aagaagacat taataacgat attagttaca tgtatgacca 120
ctattcaaac aaattgtttc tcaaactaac ctctcatgga gtagctccct cccctgcata 180
tgctcctcct ggtgctggta tgagcggtgg tggcgtgttg tggcccatga ccccggatcc 240
ctacaaaatc aagtttagt 259
<210>199
<211>49
<212>DNA
<213>人工序列
<220>
<223>标记PHD0009-01的Invader寡核苷酸
<400>199
gggagctact ccatgagagg ttagtttgag aaacaatttg tttgaatat 49
<210>200
<211>34
<212>DNA
<213>人工序列
<220>
<223>标记PHD0009-01的Invader探针
<400>200
cgcgccgagg gtggtcatac atgtaactaa tatc 34
<210>201
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0009-01的正向寡核苷酸引物
<400>201
aagtcgtgta acgggtttag attc 24
<210>202
<211>19
<212>DNA
<213>人工序列
<220>
<223>标记PHD0009-01的反向寡核苷酸引物
<400>202
cagcaccagg aggagcata 19
<210>203
<211>250
<212>DNA
<213>人工序列
<220>
<223>标记PHD0010-01的SNP序列
<400>203
aaagatttga aattagattg atacaaacga caagtcttaa ctaaattgaa gcacctgagg 60
tggaggtggc ggagcatgta atccccactg aggcatcgac ggctgaaact gagggaaaac 120
aaatggttgt tgttgtgcct gctgtggaaa ccaagaccgt tgcaaatata atatgttagt 180
tatagaacca atatcgagcg tgttgagaag aaataagaca ctcacgttca ttgcttgttg 240
ggcctgtgcg 250
<210>204
<211>34
<212>DNA
<213>人工序列
<220>
<223>标记PHD0010-01的Invader寡核苷酸
<400>204
gcaggcacaa caacaaccat ttgttttccc tcat 34
<210>205
<211>26
<212>DNA
<213>人工序列
<220>
<223>标记PHD0010-01的Invader探针
<400>205
cgcgccgagg gtttcagccg tcgatg 26
<210>206
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0010-01的正向寡核苷酸引物
<400>206
ggagcatgta atccccactg ag 22
<210>207
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0010-01的反向寡核苷酸引物
<400>207
tctcaacacg ctcgatattg gt 22
<210>208
<211>259
<212>DNA
<213>人工序列
<220>
<223>标记PHD0011-01的SNP序列
<400>208
atttccggcg gttgtggcag gccgccaaaa atagcagata attttcggcg gctataggtg 60
ggccatcgaa aattacattg gccgccgaaa atgttcaaca gtgttgttgt gatagcaacc 120
aacaggtatg agccacaata ctacacattg caacttggga aagtaattta ctggtcacca 180
tatttccgaa tagctggtta tgatatgata tttacaaatc ttccaattca ttccttcagc 240
ttaaatgaat ctcattaat 259
<210>209
<211>40
<212>DNA
<213>人工序列
<220>
<223>标记PHD0011-01的Invader寡核苷酸
<400>209
agttgcaatg tgtagtattg tggctcatac ctgttggttt 40
<210>210
<211>29
<212>DNA
<213>人工序列
<220>
<223>标记PHD0011-01的Invader探针
<400>210
cgcgccgagg gctatcacaa caacactgt 29
<210>211
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0011-01的正向寡核苷酸引物
<400>211
taggtgggcc atcgaaaatt ac 22
<210>212
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0011-01的反向寡核苷酸引物
<400>212
ttcggaaata tggtgaccag taaa 24
<210>213
<211>269
<212>DNA
<213>人工序列
<220>
<223>标记PHD0012-01的SNP序列
<400>213
ttgtaaaaaa caaggttttg taaatggatt tatttttatg ctcaaactta aattgaacaa 60
ttcaatcacg cacaattgct atgctgacag aagtttatga caagtttgag cataatgttg 120
taataataat gagacccttc atgatcttgt tgttattcca catttccatc tctcctcgaa 180
gcatagcagt gcccaccatt ttctaccgag tcagcaacaa taatctaggc tgaaagaaca 240
atggacaaca gcttcgtgtg ttgtccatc 269
<210>214
<211>51
<212>DNA
<213>人工序列
<220>
<223>标记PHD0012-01的Invader寡核苷酸
<400>214
gtggaataac aacaagatca tgaagggtct cattattatt acaacattat t 51
<210>215
<211>31
<212>DNA
<213>人工序列
<220>
<223>标记PHD0012-01的Invader探针
<400>215
cgcgccgagg gctcaaactt gtcataaact t 31
<210>216
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0012-01的正向寡核苷酸引物
<400>216
tcaatcacgc acaattgcta tg 22
<210>217
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0012-01的反向寡核苷酸引物
<400>217
agaaaatggt gggcactgct at 22
<210>218
<211>259
<212>DNA
<213>人工序列
<220>
<223>标记PHD0013-01的SNP序列
<400>218
tacaatattt gcctatggtg ttacaaggag tggaaagata catacgatgc atgtgggaaa 60
acttattaca atatttttcc tttaataagt tttacctttg tagagtgtat gtttctagtc 120
ataggctttg aagtatgcct catgctacca attaacatgc aaaaacttgg actaatctta 180
ctgatactaa gatctaacat agttgtcaac ctccttggtt ggacatttta gttgcttttg 240
ttgtattaag cttttaatt 259
<210>219
<211>45
<212>DNA
<213>人工序列
<220>
<223>标记PHD0013-01的Invader寡核苷酸
<400>219
ccaagttttt gcatgttaat tggtagcatg aggcatactt caaat 45
<210>220
<211>31
<212>DNA
<213>人工序列
<220>
<223>标记PHD0013-01的Invader探针
<400>220
cgcgccgagg gcctatgact agaaacatac a 31
<210>221
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0013-01的正向寡核苷酸引物
<400>221
acatacgatg catgtgggaa aa 22
<210>222
<211>22
<212>DNA
<213>人工序列
<220>
<223>标记PHD0013-01的反向寡核苷酸引物
<400>222
aatgtccaac caaggaggtt ga 22
<210>223
<211>269
<212>DNA
<213>人工序列
<220>
<223>标记PHD0014-01的SNP序列
<400>223
attggatttg tggtggggtg cgtgggcggg catcacgcgt ggcgatggca ctggaagcac 60
ggggaacagg gcaggtgtag ggtgggggca ggcgatggaa tggcgcggca tgcttgcggc 120
cgattgtcct tgcgtggatg gaggggattg cgggctcgag gatgaggatg gcgggatgcg 180
cgcgcctttc gtcgatcgaa cgtgggcacg ggacgaggat tgcattgcgc ggccacgcgg 240
gggcgagatt ggcgtcgtcg gtgggatgt 269
<210>224
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0014-01的Invader寡核苷酸
<400>224
ccgccatcct catcctcgag ccct 24
<210>225
<211>25
<212>DNA
<213>人工序列
<220>
<223>标记PHD0014-01的Invader探针
<400>225
cgcgccgagg gcaatcccct ccatc 25
<210>226
<211>18
<212>DNA
<213>人工序列
<220>
<223>标记PHD0014-01的正向寡核苷酸引物
<400>226
cttgcggccg attgtcct 18
<210>227
<211>18
<212>DNA
<213>人工序列
<220>
<223>标记PHD0014-01的反向寡核苷酸引物
<400>227
accgacgacg ccaatctc 18
<210>228
<211>210
<212>DNA
<213>人工序列
<220>
<223>标记PHD0015-01的SNP序列
<400>228
aattgctatt ttagcccttc taacgtgggc tctctgctat tatgtgaccc tctgtctatg 60
acttgtgtga ccatttgtgt ctatgatttg tgggactggt ggtaaaatag agaagttcac 120
aactgagagt gacaaaatag caaattctcc cacgggggcg ggggcacgac gcaccagtgt 180
ggacgtccac actatagcct tatagagtag 210
<210>229
<211>39
<212>DNA
<213>人工序列
<220>
<223>标记PHD0015-01的Invader寡核苷酸
<400>229
cccgtgggag aatttgctat tttgtcactc tcagttgtt 39
<210>230
<211>32
<212>DNA
<213>人工序列
<220>
<223>标记PHD0015-01的Invader探针
<400>230
cgcgccgagg gaacttctct attttaccac ca 32
<210>231
<211>24
<212>DNA
<213>人工序列
<220>
<223>标记PHD0015-01的正向寡核苷酸引物
<400>231
tgacttgtgt gaccatttgt gtct 24
<210>232
<211>19
<212>DNA
<213>人工序列
<220>
<223>标记PHD0015-01的反向寡核苷酸引物
<400>232
gtccacactg gtgcgtcgt 19

Claims (39)

1.向玉米植物中渐渗对毛盘孢属的抗性或增强的抗性的方法,其包含用核酸标记对所述玉米植物进行标记辅助选择,其中所述核酸标记特异性地与具有第一种核酸序列的核酸分子杂交,所述第一种核酸序列连接到位于玉米MP305的Rcg1基因座上的第二种核酸序列上,和基于所述标记辅助选择,选择所述玉米植物,其中所述核酸标记是选自表15列出的C00060-01和C00060-02的SNP标记。
2.权利要求1的方法,其中通过与不抗毛盘孢属的玉米回归亲本回交,进行所述对毛盘孢属的抗性或增强的抗性的渐渗。
3.权利要求1的方法,其中所述第一种核酸序列由选自SEQ ID NO:4-13和SEQ ID NO:23-124的至少18个邻接核苷酸片段和其互补体组成。
4.向玉米植物中渐渗对茎腐烂的抗性或增强的抗性的方法,其包含用核酸标记对所述玉米植物进行标记辅助选择,其中所述核酸标记与具有第一种核酸序列的核酸分子杂交,所述第一种核酸序列连接到位于Rcg1基因座上的第二种核酸序列上,和基于所述标记辅助选择,选择所述玉米植物,其中所述核酸标记是选自表15列出的C00060-01和C00060-02的SNP标记。
5.鉴别表现出新赋予的或增强的对毛盘孢属感染的抗性的玉米植物的方法,该方法包含,检测玉米植物至少2个标记的等位基因,其中至少一个所述标记是在UMC2041和Rcg1基因的染色体区间内部,且至少一个所述标记是在Rcg1基因和UMC2200的染色体区间内部,
其中所述至少一个标记是选自表15列出的C00060-01和C00060-02的SNP标记。
6.权利要求5的方法,其中至少一个所述标记是在UMC1086和Rcg1基因的染色体区间内部,且至少一个所述标记是在Rcg1基因和UMC2200的染色体区间内部。
7.权利要求5的方法,其中至少一个所述标记是在UMC2285和Rcg1基因的染色体区间内部,且至少一个所述标记是在Rcg1基因和UMC2187的染色体区间内部。
8.权利要求5的方法,其中至少一个所述标记是在UMC2285和Rcg1基因的染色体区间内部,且至少一个所述标记是在Rcg1基因和UMC15a的染色体区间内部。
9.权利要求8的方法,还包含选择至少4个标记,其中至少2个所述标记是在UMC2285和Rcg1基因的染色体区间内部,且至少2个所述标记是在Rcg1基因和UMC15a的染色体区间内部。
10.权利要求5的方法,其中至少一个所述标记是在SEQ ID NO.137内部,其中所述至少一个标记能检测位于选自下述的位置处的多态性:
(a)位于7230至7535的核苷酸的SEQ ID NO:137中的位置;
(b)位于11293至12553的核苷酸的SEQ ID NO:137中的位置;
(c)位于25412至29086的核苷酸的SEQ ID NO:137中的位置;和
(d)位于43017至50330的核苷酸的SEQ ID NO:137中的位置。
11.权利要求5的方法,其中在UMC2041和Rcg1基因的染色体区间内部的至少一个标记选自表16列出的标记,且其中在Rcg1基因和UMC2200的染色体区间内部的至少一个标记选自表16列出的标记。
12.权利要求5的方法,还包含选择至少4个标记,其中至少2个所述标记是在UMC2041和Rcg1基因的染色体区间内部,且至少2个所述标记是在Rcg1基因和UMC2200的染色体区间内部。
13.权利要求12的方法,其中在UMC2041和Rcg1基因的染色体区间内部的至少2个标记选自表16列出的标记,且其中在Rcg1基因和UMC2200的染色体区间内部的至少2个标记选自表16列出的标记。
14.权利要求5的方法,还包含选择至少6个标记,其中至少3个所述标记是在UMC2041和Rcg1基因的染色体区间内部,且至少3个所述标记是在Rcg1基因和UMC2200的染色体区间内部。
15.权利要求14的方法,其中在UMC2041和Rcg1基因的染色体区间内部的至少3个标记选自表16列出的标记,且其中在Rcg1基因和UMC2200的染色体区间内部的至少3个标记选自表16列出的标记。
16.权利要求5的方法,其中所述方法还包含检测下述的至少2个或更多个:(a)在MZA11123处的等位基因7,(b)在MZA2591处的等位基因2,和(c)在MZA3434处的等位基因8。
17.权利要求5的方法,还包含在计算机可读介质中电子传递或电子储存代表检测到的等位基因的数据。
18.权利要求5的方法,还包含在玉米植物中检测在Rcg1基因内的至少一个标记的存在或不存在。
19.权利要求18的方法,还包含选择至少4个标记,其中至少2个所述标记是在UMC2285和Rcg1基因的染色体区间内部,且至少2个标记是在Rcg1基因和UMC15a的染色体区间内部。
20.权利要求18的方法,其中所述Rcg1基因从供体玉米植物渐渗进受体玉米植物,以生成渐渗的玉米植物。
21.权利要求20的方法,其中选择所述渐渗的玉米植物在Rcg1基因和UMC15a之间区域的重组事件,从而使得渐渗的玉米植物保持第一个玉米MP305衍生的在Rcg1基因和UMC15a定义的染色体区间,且不保持第二个玉米MP305衍生的、不在Rcg1基因和UMC15a定义的染色体区间的染色体区间。
22.鉴别表现出增强的对毛盘孢属感染的抗性的玉米植物的方法,该方法包含,检测玉米植物中存在或不存在至少一个在Rcg1基因座处的标记,和选择其中存在至少一个标记的玉米植物,其中所述至少一个标记是选自表15列出的C00060-01和C00060-02的SNP标记。
23.权利要求22的方法,其中所述至少一个标记是在SEQ ID NO:137内部。
24.权利要求23的方法,其中所述至少一个标记能检测位于选自下述的位置处的多态性:
(a)位于1至536的核苷酸的SEQ ID NO:137中的位置;
(b)位于7230至7535的核苷酸的SEQ ID NO:137中的位置;
(c)位于11293至12553的核苷酸的SEQ ID NO:137中的位置;
(d)位于25412至29086的核苷酸的SEQ ID NO:137中的位置;和
(e)位于43017至50330的核苷酸的SEQ ID NO:137中的位置。
25.权利要求22的方法,其中所述至少一个标记是在Rcg1编码序列内部。
26.权利要求25的方法,其中所述Rcg1编码序列包含编码多肽的核苷酸序列,其中所述多肽由SEQ ID NO:3的氨基酸序列组成。
27.权利要求25的方法,其中所述至少一个标记是在SEQ ID NO:1所述的多核苷酸内部。
28.权利要求25的方法,其中所述至少一个标记检测位于413、958、971、1099、1154、1235、1250、1308、1607、2001、2598和3342中的一个或多个位置的SEQ ID NO:1所述的核苷酸序列中的位置处的单核苷酸多态性。
29.权利要求25的方法,其中所述至少一个标记是由包含第一引物和第二引物的引物对产生的扩增子上的FLP标记,其中所述第一引物选自:
(a)SEQ ID NO:35所述的序列和其互补体;
(b)SEQ ID NO:37所述的序列和其互补体;
(c)SEQ ID NO:39所述的序列和其互补体;和
(d)SEQ ID NO:41所述的序列和其互补体;
且,其中所述第二引物选自:
(a)SEQ ID NO:36所述的序列和其互补体;
(b)SEQ ID NO:38所述的序列和其互补体;
(c)SEQ ID NO:40所述的序列和其互补体;和
(d)SEQ ID NO:42所述的序列和其互补体。
30.权利要求22的方法,其中所述至少一个标记检测从Rcg1mRNA转录物衍生的、且Rcg1特有的mRNA序列。
31.权利要求22的方法,其中所述方法还包含检测玉米植物中存在或不存在至少2个在Rcg1基因座内的标记。
32.权利要求31的方法,其中所述至少2个标记是表15列出的C00060-01和C00060-02。
33.权利要求32的方法,其中所述Rcg1基因座从供体玉米植物渐渗进受体玉米植物,以生成渐渗的玉米植物。
34.权利要求22的方法,还包含在计算机可读介质中电子传递或电子储存代表至少一个标记的存在或不存在的数据。
35.位于Rcg1基因座内部的遗传标记,其中所述遗传标记是选自表15列出的C00060-01和C00060-02的SNP标记。
36.位于Rcg1基因座内部的遗传标记,其中所述遗传标记在SEQ ID NO:137上,在选自下述的区域内:
(a)位于1至536的核苷酸的SEQ ID NO:137中的区域;
(b)位于7230至7535的核苷酸的SEQ ID NO:137中的区域;
(c)位于11293至12553的核苷酸的SEQ ID NO:137中的区域;
(d)位于25412至29086的核苷酸的SEQ ID NO:137中的区域;知
(e)位于43017至50330的核苷酸的SEQ ID NO:137中的区域。
37.权利要求35的遗传标记,其中所述遗传标记在Rcg1基因内部。
38.权利要求37的遗传标记,其中所述遗传标记在SEQ ID NO:1的下述区域内:
(a)SEQ ID NO:1的位置550-658;
(b)SEQ ID NO:1的位置1562-1767。
39.权利要求37的遗传标记,其中所述遗传标记在由包含第一引物和第二引物的引物对产生的扩增子上,其中所述第一引物选自:
(a)SEQ ID NO:23和其互补体;
(b)SEQ ID NO:25和其互补体;
(c)SEQ ID NO:27和其互补体;
(d)SEQ ID NO:29和其互补体;
(e)SEQ ID NO:31和其互补体;
(f)SEQ ID NO:33和其互补体;
(g)SEQ ID NO:35和其互补体;
(h)SEQ ID NO:37和其互补体;
(i)SEQ ID NO:39和其互补体;和
(j)SEQ ID NO:41和其互补体;
且,其中所述第二引物选自:
(a)SEQ ID NO:24和其互补体;
(b)SEQ ID NO:26和其互补体;
(c)SEQ ID NO:28和其互补体;
(d)SEQ ID NO:30和其互补体;
(e)SEQ ID NO:32和其互补体;
(f)SEQ ID NO:34和其互补体;
(g)SEQ ID NO:36和其互补体;
(h)SEQ ID NO:38和其互补体;
(i)SEQ ID NO:40和其互补体;和
(j)SEQ ID NO:42和其互补体。
CN200680019821.3A 2005-04-04 2006-04-04 用于制备抗真菌病原体的植物的多核苷酸和方法 Active CN101189341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610894769.1A CN107338254B (zh) 2005-04-04 2006-04-04 用于制备抗真菌病原体的植物的多核苷酸和方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US66824105P 2005-04-04 2005-04-04
US60/668,241 2005-04-04
US67566405P 2005-04-28 2005-04-28
US60/675,664 2005-04-28
PCT/US2006/012443 WO2006107931A2 (en) 2005-04-04 2006-04-04 Polynucleotides and methods for making plants resistant to fungal pathogens

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201610894769.1A Division CN107338254B (zh) 2005-04-04 2006-04-04 用于制备抗真菌病原体的植物的多核苷酸和方法

Publications (2)

Publication Number Publication Date
CN101189341A CN101189341A (zh) 2008-05-28
CN101189341B true CN101189341B (zh) 2016-10-19

Family

ID=39481101

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610894769.1A Active CN107338254B (zh) 2005-04-04 2006-04-04 用于制备抗真菌病原体的植物的多核苷酸和方法
CN200680019821.3A Active CN101189341B (zh) 2005-04-04 2006-04-04 用于制备抗真菌病原体的植物的多核苷酸和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610894769.1A Active CN107338254B (zh) 2005-04-04 2006-04-04 用于制备抗真菌病原体的植物的多核苷酸和方法

Country Status (3)

Country Link
CN (2) CN107338254B (zh)
AR (1) AR111844A2 (zh)
ZA (1) ZA200709792B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160340748A1 (en) * 2013-12-20 2016-11-24 University Of Pretoria Markers for disease resistance in maize
CN108660244B (zh) * 2018-05-21 2021-02-02 黑龙江省农业科学院农产品质量安全研究所 一组适用于毛细管电泳检测技术的玉米ssr分子标记及其应用
CN110079626B (zh) * 2019-03-28 2021-06-01 河南科技大学 用于新月弯孢菌遗传多样性和亲缘关系分析的ssr引物及应用
CN112175988B (zh) * 2020-09-15 2021-06-15 广东省农业科学院蔬菜研究所 黄瓜韧皮部凝集素CsPL1在抗瓜类疫病中的应用
CN112251528B (zh) * 2020-10-19 2021-07-06 北京林业大学 用于鉴定百合倍性的微卫星dna分子标记及其应用
CN114805507B (zh) * 2021-01-28 2024-02-09 中国科学院遗传与发育生物学研究所 水稻OsREIN1T219I蛋白及其编码基因与应用
CN116694629B (zh) * 2023-07-31 2023-09-29 隆平生物技术(海南)有限公司 转基因玉米事件lp038-1及其检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE369418T1 (de) * 1999-03-31 2007-08-15 Syngenta Participations Ag Mykotoxin-resistente transgene weizenpflanze, verfahren zur herstellung und verwendung derselben
EP1288301A1 (en) * 2001-08-31 2003-03-05 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Berlin Plant-derived resistance gene

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sharopova等.Development and mapping of SSR markers for maize.《Plant Mol Biol》.2002,第48卷463-481. *

Also Published As

Publication number Publication date
CN107338254B (zh) 2021-07-06
AR111844A2 (es) 2019-08-28
CN107338254A (zh) 2017-11-10
ZA200709792B (en) 2008-11-26
CN101189341A (zh) 2008-05-28

Similar Documents

Publication Publication Date Title
US10731225B2 (en) Methods for making plants resistant to fungal pathogens
EP1874935B2 (en) Polynucleotides and methods for making plants resistant to fungal pathogens
US20230416774A1 (en) Wheat stripe resistance genes and method of use
CN101189341B (zh) 用于制备抗真菌病原体的植物的多核苷酸和方法
Butler et al. 11111111111111111111111111111111111111111111111111111111111111111111111111 II OI IIi

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant