CN111247244B - 赋予对真菌病原体抗性的基因 - Google Patents

赋予对真菌病原体抗性的基因 Download PDF

Info

Publication number
CN111247244B
CN111247244B CN201880068589.5A CN201880068589A CN111247244B CN 111247244 B CN111247244 B CN 111247244B CN 201880068589 A CN201880068589 A CN 201880068589A CN 111247244 B CN111247244 B CN 111247244B
Authority
CN
China
Prior art keywords
ser
leu
gly
val
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880068589.5A
Other languages
English (en)
Other versions
CN111247244A (zh
Inventor
B·克塞尔
M·奥祖诺娃
T·普雷斯特尔
D·朔伊尔曼
G·赫伦
B·凯勒
S·克拉廷格
T·威克
杨平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universitaet Zuerich
KWS SAAT SE and Co KGaA
Original Assignee
Universitaet Zuerich
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universitaet Zuerich, KWS SAAT SE and Co KGaA filed Critical Universitaet Zuerich
Publication of CN111247244A publication Critical patent/CN111247244A/zh
Application granted granted Critical
Publication of CN111247244B publication Critical patent/CN111247244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8282Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for fungal resistance
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H3/00Processes for modifying phenotypes, e.g. symbiosis with bacteria
    • A01H3/04Processes for modifying phenotypes, e.g. symbiosis with bacteria by treatment with chemicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/48Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase
    • C12Q1/485Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase involving kinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/99Other protein kinases (2.7.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明涉及核酸分子,所述核酸分子编码赋予植物针对真菌病原体例如大斑病长蠕孢的抗性的多肽。本发明进一步涉及包含所述核酸分子的植物(或其部分),以及有关所述核酸分子的方法。

Description

赋予对真菌病原体抗性的基因
技术领域
本发明涉及核酸分子,所述核酸分子编码赋予植物针对真菌病原体例如大斑病长蠕孢(Helminthosporium turcicum)的抗性的多肽。本发明进一步涉及包含所述核酸分子的植物(或其部分),以及有关所述核酸分子的方法。
发明背景
在玉米(Zea mays L.)中,有许多引起叶疾病的真菌病原体。目前能够在热带和温带气候条件下(如欧洲和北美的大部分以及非洲和印度)引起最多破坏的真菌,已知为大斑病长蠕孢或者也称作玉米大斑病菌(Exserohilum turcicum(有性型:Setosphaeriaturcica))。大斑病长蠕孢(H.turcicum)是引起已知为“玉米大斑病”(NCLB)的叶斑病的起因,其在潮湿年份可以流行病的比例发生,攻击易受感染的玉米玉米品种并引起大量的破坏和30%的产量的可观损失以及同时影响更大的区域。继而从1970年代起,就已经在遗传材料中寻找天然的抗性。目前,已知有数量(quantitative)和质量(qualitative)抗性,即使是不完整的。寡基因或多基因数量抗性在表现型方面显得不完全并且对于小种没有特异性以及会受到额外的和部分显性的基因影响,而质量抗性似乎通常是小种特异性的并且可以在以下基因座通过个体的、大多为显性的基因来遗传:如HT1、HT2、HT3、Htm1或HTN1(Lipps et al.,1997,“Interaction of Ht and partial resistance to Exserohilumturcicum in maize."Plant Disease 81:277-282;Welz&Geiger,2000,"Genes forresistance to northern corn leaf blight in diverse maize populations."PlantBreeding 119:1-14)。在许多频繁使用的近交玉米品系如W22、A619、B37或B73中的回交(backcross)已经成功地实现了HT基因座的渐渗(introgression),其中它们呈现出部分显性和作为各自遗传背景的功能的表达(Welz,1998,"Genetics and epidemiology of thepathosystem Zea mays/Setosphaeria turcica"Habilitationsschrift,Institut fürPfIanzenzüchtung,Saatgutforschung und Populations-genetik,Hohenheim)。
虽然在玉米中对NCLB抗性有此种复杂的遗传结构,但是目前原则上使用位于染色体2的长臂上的HT1基因结合部分数量抗性已经足以在玉米中控制长蠕孢疾病(helminthrosporiosis)(Welz,1998)。其基础在于,从全球来看,大斑病长蠕孢的小种0和1是最普遍的(大约55%)(Lipps等,1997),而其它的小种如2N和23N仅仅是稀少的并且即使是也是在地理上有限的区域(Welz,1998)。此小种0对于具有HT1(也参见表1)的玉米植物而言是无毒性的,因而当具有适宜的数量抗性时,其呈现出对NCLB的足够的一般抗性。然而,许多研究已经报道了不太常见小种日益增加的散播(Jordan等,1983,"Occurrence ofrace 2 of Exserohilum turcicum on corn in the central and eastern UnitedStates."Plant Disease 67:1163-1165;Welz,1998)。其原因与病原体的种群动态相关,种群动态使得病原体毒性可以通过无毒性基因的新突变以及可用毒性基因的新组合来发生变化。这可以导致发生新的、有时更有侵略性的病原体小种。例如在巴西,大斑病长蠕孢种群已经表现出在小种组成方面比起例如北美来说实质上更加多样化。在20世纪90年代已经报道了破坏HT1基因赋予的抗性的大斑病长蠕孢小种。另外,抗性基因对某些环境因素有不稳定性,如在一些气候区域的温度和光强度(Thakur等,1989,"Effects of temperatureand light on virulence of Exserohilum turcicum on corn."Phytopathology 1989,79:631–635)。这一进展的后果在于,使用新型的HT抗性基因用于商业玉米植物的生产以便在玉米中引导出针对大斑病长蠕孢的更广谱的且更长效的抗性在重要性上正在日益增加。
表1:针对不同的大斑病长蠕孢小种的抗性基因座的抗性(R)和敏感性(S)概述:
单基因HTN1抗性的一个来源是墨西哥地方品种“Pepitilla”(Gevers,1975,"Anew major gene for resistance to Helminthosporium turcicum leaf blight ofmaize."Plant Dis Rep 59:296-300)。HTN1渐渗品系呈现定位在染色体8的长臂上的基因。与通常的HT抗性基因相反,HTN1通过延缓孢子形成的发生而赋予抗性,并由此防止病斑的发展。结果,形成的病斑较少且较小以及孢子形成区域减少(Simcox&Bennetzen,1993,"Theuse of molecular markers to study Setospaeria turcica resistance in maize."Phytopathology 83:1326-1330)。没有形成褪绿坏死病斑,如具有HT1、HT2或HT3赋予的抗性所发生的那些(Gevers,1975)。WO2015/032494公开了致病基因RLK1的鉴定,所述致病基因RLK1赋予玉米中bin 8.06上的“Pepitilla”抗性表型,并且描述了适合于受益于该抗性基因座而没有紧密连锁的、不希望的连锁累赘导致对产量潜力的负面影响的分子标记。
在WO2011/163590中,已经公开了基因型PH99N和PH26N作为染色体8bin 5上的NCLB抗性的替代来源。
为了从玉米杂交种DK888中鉴定出NCLB的抗性基因,Chung等在2010年发表了一项用于精细绘制bin 8.06抗性基因座的研究(Chung et al.2010"Characterization andfine-mapping of a resistance locus for northern leaf blight in maize bin8.06"Theoretical and Applied Genetics 121(2):205-227)。对长蠕孢属小种特异性的研究最初表明,在功能上,抗性基因座与HT2和HTN1基因紧密连锁。使用B73参考的0.46Mb大小的染色体片段的基因组注释提示了几个推定的开放阅读框;但是,致病基因尚未鉴定,并且功能描述也未描述。
因此,本发明的目的是鉴定和/或进一步表征编码赋予或增加对真菌病原体例如大斑病长蠕孢的抗性的多肽的植物抗性基因。
发明内容
本发明提供了核酸分子,所述核酸分子包含具有SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列的核苷酸序列或由具有SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列的核苷酸序列组成。还提供了核酸分子,所述核酸分子包含编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列,或由编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列组成。
进一步提供了包含与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列具有至少96%相同性的核苷酸序列的核酸分子或由与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列具有至少96%相同性的核苷酸序列组成的核酸分子,以及包含编码与SEQ ID NO:3所示氨基酸序列具有至少92%相同性的氨基酸序列的核苷酸序列的核酸分子或由编码与SEQID NO:3所示氨基酸序列具有至少92%相同性的氨基酸序列的核苷酸序列组成的核酸分子。
还提供了核酸分子,其包含在严格杂交条件下与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列的互补链杂交的核苷酸序列或与编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列的互补链杂交的核苷酸序列,或由在严格杂交条件下与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列的互补链杂交的核苷酸序列或与编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列的互补链杂交的核苷酸序列组成。
此外,提供了包含编码蛋白质的核苷酸序列或由编码蛋白质的核苷酸序列组成的核酸分子,所述蛋白质通过取代、缺失和/或添加一个或多个氨基酸的方式衍生自由SEQ IDNO:1或SEQ ID NO:2的核苷酸序列编码的氨基酸序列或衍生自SEQ ID NO:3所示的氨基酸序列。
根据本发明的核酸分子编码多肽,所述多肽是壁相关受体样激酶1(WAK RLK1)或功能上属于壁相关受体样激酶的家族。
本发明的核酸分子编码能够在其中表达所述多肽的植物中,优选在其中表达所述多肽的玉米(Zea mays)物种的植物中,赋予(或增加)对由真菌病原体,尤其是由大斑病长蠕孢,优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性的多肽。
在另一方面,提供了包含本发明的核酸分子的载体或表达盒。优选地,在所述载体或表达盒中,本发明的核苷酸序列可操作地连接至调控元件,允许核苷酸序列在植物细胞中表达。
进一步提供了包含本发明的核酸分子或本发明的载体或表达盒的宿主细胞。
在另一方面,提供了由本发明的核酸分子编码的多肽。该多肽是壁相关受体样激酶1(WAK RLK1)或在功能上属于壁相关受体样激酶1的家族。优选地,所述多肽能够在其中表达所述多肽的植物中,优选在其中表达所述多肽的玉米物种的植物中,赋予(或增加)对由大斑病长蠕孢,优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性。
另外,所述多肽可能不能在其中表达所述多肽的植物中,优选在其中表达所述多肽的玉米物种的植物中赋予或增加对由大斑病长蠕孢小种2和/或3引起的植物病害的抗性。所述植物可以显示出对被大斑病长蠕孢小种2和/或3感染的敏感反应。
此外,提供了植物,优选地是玉米物种的植物,其包含转基因的(作为转基因)或内源的(作为内源基因)本发明的核酸分子、本发明的载体、本发明的表达盒、或本发明的多肽。优选地,所述植物对由大斑病长蠕孢,特别是由大斑病长蠕孢小种0、1和/或N引起的植物病害具有抗性。所述植物可以显示出对被大斑病长蠕孢2和/或3感染的敏感反应。所述植物可以是转基因植物或基因编辑的植物。所述植物可以是内源地包含本发明的核酸分子的植物,其中所述基因组侧翼区不包含位于标记SYN14136和标记MA0021的等位基因之间的A619HT2或A619HT3衍生的区间或位于标记MA0022和标记SYN4196的等位基因之间的A619HT2或A619HT3衍生的区间。还提供了本发明的植物的一部分、本发明的植物的植物细胞和本发明的植物的种子,其中所述种子包含转基因的(作为转基因的)或内源的(作为内源基因)本发明的核酸分子、本发明的载体、本发明的表达盒或本发明的多肽。
根据另一个方面,提供了鉴定或选择具有对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的真菌病原体引起的植物病害的抗性增强的植物,优选玉米物种的植物、或其部分、细胞或种子的方法或过程,所述方法或过程包括以下步骤:(a)在植物、或其部分、细胞或种子中(或在植物、或其部分、细胞或种子的样品中)检测如上所述的本发明核酸分子的存在,或包含选自由以下组成的组的核苷酸序列组成的核酸分子或由选自由以下组成的组的核苷酸序列组成的核酸分子的存在:(i)与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列具有至少60%相同性的核苷酸序列,(ii)编码与SEQ IDNO:3所示的氨基酸序列具有至少60%相同性的氨基酸序列的核苷酸序列,(iii)与SEQ IDNO:1或SEQ ID NO:2所示的核苷酸序列的核苷酸第1-920位(外显子1;SEQ ID NO:6)具有至少85%相同性的核苷酸序列,和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23252-23288位(外显子2;SEQ ID NO:7)具有至少60%的相同性或与SEQ ID NO:2所示核苷酸序列的核苷酸第921-957位(外显子2;SEQ ID NO:7)具有至少60%的相同性的核苷酸序列,和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23586-24632位(外显子3;SEQ ID NO:8)具有至少98%的相同性或与SEQ ID NO:2所示核苷酸序列的核苷酸第958-2004位(外显子3;SEQID NO:8)具有至少98%的相同性的核苷酸序列,(iv)编码与SEQ ID NO:3所示的氨基酸序列的第1-306位具有至少75%的相同性和/或与SEQ ID NO:3所示的氨基酸序列的第307-319位具有至少60%的相同性和/或与SEQ ID NO:3所示氨基酸序列的第320-668位具有至少98%的相同性的氨基酸序列的核苷酸序列,其中(i)至(iv)中任一项的核酸分子编码能够在其中表达所述多肽的植物中,优选在其中表达所述多肽的玉米物种的植物中,赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性的多肽,并且其中优选地,(i)至(iv)中任一项的核酸分子编码这样的多肽,所述多肽是壁相关受体样激酶1(WAK RLK1)的家族或在功能上属于壁相关受体样激酶1(WAK RLK1)的家族;和(b)鉴定或选择植物或其部分、细胞或种子,在所述植物或其部分、细胞或种子中存在(a)中定义的核酸分子,其具有对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性或增加的抗性。
进一步提供了鉴定对由大斑病长蠕孢,特别是由大斑病长蠕孢小种0、1和/或N引起的植物病害具有抗性并内源包含本发明的核酸分子的植物,优选玉米物种植物的方法或过程,所述方法或过程包括在植物等位基因中检测至少两个标记,其中至少一个所述标记在SYN14136和本发明的核酸分子之间的染色体区间上或在SYN14136和本发明的核酸分子之间的染色体区间内,以及至少一个所述标记在本发明的核酸分子和SYN4196之间的染色体区间上或在本发明的核酸分子和SYN4196之间的染色体区间内。
在另一方面,提供了通过根据本发明的鉴定或选择的方法或过程鉴定或选择的植物或其后代。
在另一方面,提供了鉴定这样的抗性基因的等位基因的方法,所述等位基因在玉米中赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性,以及优选地编码壁相关受体样激酶1(WAK RLK1)的家族的多肽或在功能上属于壁相关受体样激酶1(WAK RLK1)的家族的多肽,其中该方法包括以下步骤:(a)使用(i)至少一个源自或衍生自玉米基因型的编码核苷酸序列进行序列比较,其中所述核苷酸序列优选地定位于bin8.05抗性基因座或bin8.06抗性基因座,和(ii)作为参考序列,本发明的核苷酸序列,优选SEQ ID NO:1或SEQ IDNO:2所示的核苷酸序列或编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列,或其部分,或衍生自至少两个核苷酸序列的组的共有序列,其中一个核苷酸序列是本发明的核苷酸序列,优选SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列或编码SEQ ID NO:3所示氨基酸序列的核苷酸序列,或其部分,并且其中所述至少两个核苷酸序列的组的每个核苷酸序列编码能够在其中表达所述多肽的玉米中赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性,并优选定位于bin 8.05抗性基因座或bin 8.06抗性基因座,并优选编码是壁相关受体样激酶1(WAK RLK1)的家族或在功能上属于壁相关受体样激酶1(WAK RLK1)的家族的多肽;以及(b)如果序列比较显示以下则鉴定等位基因,(i)在核苷酸水平上这样的序列相同性:与SEQ ID NO:1或SEQ ID NO:2所示核苷酸序列的核苷酸第1-920位具有至少85%的相同性,和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23252-23288位具有至少60%相同性或与SEQ ID NO:2所示核苷酸序列的核苷酸第921-957位具有至少60%相同性,和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23586-24632位具有至少98%的相同性或与SEQ ID NO:2所示核苷酸序列的核苷酸第958-2004位具有至少98%的相同性,和/或(ii)在编码的氨基酸水平上这样的序列相同性:与SEQ ID NO:3所示氨基酸序列的第1-306位具有至少75%相同性和/或与SEQ ID NO:3所示的氨基酸序列的第307-319位具有至少60%相同性和/或与SEQ ID NO:3所示的氨基酸序列的第320-668位具有至少98%相同性。
进一步提供了核酸分子,其包含通过鉴定抗性基因的等位基因的方法鉴定的抗性基因的等位基因的核苷酸序列或由通过鉴定抗性基因的等位基因的方法鉴定的抗性基因的等位基因的核苷酸序列组成。
在另一个方面,提供了在植物中,优选在玉米物种的植物中,赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性,包括以下步骤:(a)将本发明的核酸分子、本发明的表达盒或本发明的载体引入植物的至少一个细胞中,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,(b)从所述至少一个细胞再生植物,和(c)在植物中引起所述核酸分子的表达。
进一步提供了一种在本发明的植物中增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性的方法,包括在植物或植物的至少一个细胞中降低本发明的核酸分子、本发明的表达盒或本发明的载体的表达水平的步骤,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,优选与抗性野生型植物中内源基因的表达水平相比。
在另一方面,提供了产生植物,优选玉米物种的植物,或其部分、细胞或种子的方法,所述植物具有对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的(增强的)抗性,包括以下步骤:(a)将本发明的核酸分子、本发明的表达盒或本发明的载体引入植物中或植物的至少一个细胞中,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,(b)任选地,从所述至少一个细胞再生植物;和(c)在植物中引起所述核酸分子的表达。
在另一方面,提供了通过根据本发明的产生植物的方法产生的植物或其后代。
进一步提供了在植物(优选玉米物种的植物)的群体中控制真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N的侵染的方法,包括以下步骤:(a)在农业和园艺领域中生长本发明的植物,和(b)引起本发明的核酸分子、本发明的表达盒或本发明的载体的表达,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成。
本发明的另一方面是长度至少为15、16、17、18、19或20,优选至少为21、22、23、24或25,更优选至少为30、35、40、45、50、100、200、300或500个核苷酸的寡核苷酸,其中所述寡核苷酸能够与以下杂交或退火:(i)本发明的核酸分子,(ii)包含SEQ ID NO:4或SEQ IDNO:5的核苷酸序列的核酸分子,或(iii)与(i)或(ii)互补的核酸分子。
进一步提供了寡核苷酸对或包含所述寡核苷酸的试剂盒,其中所述寡核苷酸适合于作为正向引物和反向引物退火至植物基因组(优选是玉米基因组)中的区域,其显示出与本发明的核酸分子共分离,优选完美的共分离。
在另一方面,提供了至少一种寡核苷酸作为分子标记或其部分在鉴定或选择对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害具有增强的抗性的植物,优选玉米物种的植物,或其部分、细胞或种子的方法中的用途,或在鉴定在玉米中赋予或增强对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害具有增强的抗性的方法中的用途,其中所述分子标记能够检测至少一个单核苷酸多态性、缺失或插入诊断用于本发明核酸分子和/或包含如上所述的寡核苷酸和/或是如上所述的寡核苷酸对或试剂盒。
一方面,提供了至少一个或至少两个寡核苷酸作为分子标记或其部分在如上所述的鉴定植物的方法或过程中或在消除与本发明的核酸分子紧密连锁的连锁累赘的方法或过程中的用途,用于检测位于标记SYN14136和标记MA0021的等位基因之间的A619HT2或A619HT3衍生的区间或位于标记MA0022和标记SYN4196的等位基因之间的A619HT2或A619HT3衍生的区间的存在或不存在。
在另一个方面,提供了用于在植物,优选在玉米物种的植物中,检测本发明的核酸分子的存在或不存在的方法,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,所述方法包括以下步骤:(a)从植物的至少一个细胞中分离DNA,和(b)使用分子标记来检测本发明的核酸分子的存在或不存在,其中所述分子标记能够检测至少一个单核苷酸多态性、缺失或插入诊断用于本发明的核酸分子和/或包含如上所述的寡核苷酸和/或是如上所述的寡核苷酸对或试剂盒。
附图简述
图1:显示了可用于转化玉米植物的载体p7U-nativeHT2_CDS_2。将含有在天然启动子(SEQ ID NO:4)和终止子(SEQ ID NO:5)的控制下的HT2基因(SEQ ID NO:2)的cDNA的表达盒转化到含有例如除草剂基因(例如:BASTA抗性、草甘膦抗性或ALS抑制剂抗性)的二元载体中,用于随后转化到根癌农杆菌(Agrobacterium tumefaciens)中用于农杆菌介导的植物转化到玉米基因型A188中。
图2A-D:显示了RLK1等位基因HT2(SEQ ID NO:2)、HTN1(SEQ ID NO:9)、PH99N(SEQID NO:11)和PH26N(SEQ ID NO:13)的CLUSTAL O(1.2.4)多序列比对。在每个块的最低行中,缺少星号表示具有序列差异的位置。
图3A和B:显示了RLK1多肽的ClustalV(PAM250)多序列比对:RLK1_A619HT2_CDS.seq(SEQ ID NO:3),RLK1_A619HT3_CDS.seq(与SEQ ID NO:3相同),RLK1_B37HTN_CDS.seq(SEQ ID NO:10),RLK1_A619HT2_Exon1.seq(SEQ ID NO:6),RLK1_A619HT2_Exon2.seq(SEQ ID NO:7)和RLK1_A619HT2_Exon3.seq(SEQ ID NO:8)。
图4A-C:显示了衍生自基因型A188的HT2的cDNA(SEQ ID NO:2)和RLK1等位基因的cDNA的序列比对。在A188等位基因的第1458至1459位,已鉴定出引起早期终止密码子(粗体和带下划线的)的2bp插入“AC”(黑色背景上的白色字母)。
图5:显示了A619HT2和修饰的A188RLK1的氨基酸的序列比对。修饰的A188RLK与A619HT2具有99.1%相同性。
图6:显示了标记位置相对于AGPv02的标记位置的图。
发明详述
本发明基于对HT2基因的鉴定,所述HT2基因编码赋予(或增加)植物针对真菌病原体例如大斑病长蠕孢的抗性的多肽。
因此,在本发明的一个方面,提供了核酸分子,其包含编码所述HT2基因的核苷酸序列或由编码所述HT2基因的核苷酸序列组成。在一实施方案中,本发明的核酸分子包含具有SEQ ID NO:1(HT2的基因组DNA)或SEQ ID NO:2(HT2的cDNA)所示的核苷酸序列的核苷酸序列或由具有SEQ ID NO:1(HT2的基因组DNA)或SEQ ID NO:2(HT2的cDNA)所示的核苷酸序列的核苷酸序列组成。还提供了包含编码SEQ ID NO:3(HT2蛋白)所示的氨基酸序列的核苷酸序列或由编码SEQ ID NO:3(HT2蛋白)所示的氨基酸序列的核苷酸序列组成的核酸分子。
进一步提供了核酸分子,其包含这样的核苷酸序列或由这样的核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列具有至少96%的相同性(优选在全长上)。优选地,与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列具有至少97%、98%、99%或99.5%的相同性(优选在全长上)的核苷酸序列。还提供了核酸分子,其包含这样的核苷酸序列或由这样的核苷酸序列组成,所述核苷酸序列编码与SEQ ID NO:2所示的氨基酸序列具有至少92%相同性(优选在全长上)的氨基酸序列。优选地,所述核酸分子包含这样的核苷酸序列或由这样的核苷酸序列组成,所述核苷酸序列编码与SEQ ID NO:3所示的氨基酸序列具有至少93%、94%、95%、96%、97%、98%、99%或99.5%相同性(优选在全长上)的氨基酸序列。
在另一个实施方案中,提供了核酸分子,其包含这样的核苷酸序列或由这样的核苷酸序列组成,所述核苷酸序列在严格杂交条件下与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列的互补链或编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列杂交。
此外,提供了核酸分子,其包含这样的核苷酸序列或由这样的核苷酸序列组成,所述核苷酸序列编码通过一个或多个氨基酸的取代、缺失和/或添加衍生自由SEQ ID NO:1或SEQ ID NO:2的核苷酸序列编码的蛋白质,或衍生自SEQ ID NO:3所示的氨基酸序列的蛋白质。
氨基酸的缺失、取代或添加可以通过本领域已知的技术进行。核苷酸序列中的诱变可以通过公知的方法例如Kunkel法、空位双链法或与该公知的方法相似的方法引起。例如,诱变可以使用基于定点诱变方法的诱变试剂盒(例如Mutant-K或Mutant-G(产品名称,TAKARA Bio))、LA PCR体外诱变系列试剂盒(产品名称,TAKARA Bio)等来引起。可选地,诱变方法可以是使用以EMS(甲磺酸乙酯)、5-溴尿嘧啶、2-氨基嘌呤、羟胺、N-甲基-N'-硝基-N-亚硝基胍为代表的化学诱变剂或其他致癌化合物的方法,包括使用诸如X射线、α射线、β射线、γ射线或离子束的放射性射线进行辐射处理的方法,或包括紫外线处理的方法。
当氨基酸残基改变时,优选将氨基酸突变为保留氨基酸特性的不同氨基酸。氨基酸特性的示例是:疏水性氨基酸(A、I、L、M、F、P、W、Y和V),亲水性氨基酸(R、D、N、C、E、Q、G、H、K、S和T),含有脂肪族侧链的氨基酸(G、A、V、L、I和P),含有羟基的侧链氨基酸(S、T和Y),含有含硫侧链的氨基酸(C和M),含有羧酸和酰胺基侧链的氨基酸(D、N、E和Q),含有碱性侧链的氨基酸(R、K和H),含有芳香族侧链的氨基酸(H、F、Y和W)(氨基酸用括号中的一个字母表示)。每个组内的氨基酸取代被称为保守取代。保守取代是优选的。
优选地,本发明的核酸分子编码能够在其中表达该多肽的植物中赋予(或增加)对由真菌病原体引起的植物病害的抗性的多肽。
另外,本发明的核酸分子编码这样的多肽,所述多肽可能不能在其中表达该多肽的植物中,优选在其中表达该多肽的玉米物种的植物中,赋予对由大斑病长蠕孢小种2和/或3引起的植物病害的抗性。所述植物可能显示出对被大斑病长蠕孢小种2和/或3感染的敏感反应。
本发明的核酸分子的另一个实例可以是包含SEQ ID NO:23所示的核苷酸序列或由SEQ ID NO:23所示的核苷酸序列组成的核酸分子,或包含编码SEQ ID NO:24所示的氨基酸序列的核苷酸序列或由编码SEQ ID NO:24所示的氨基酸序列的核苷酸序列组成的核酸分子。
在一实施方案中,真菌病原体属于子囊菌(Ascomycota)或担子菌(Basidiomycota)的门。真菌病原体可能属于古菌科(Pleosporaceae)、伞形科(Pucciniaceae)或葡萄球菌科(Botryosphaeriaceae)的科。优选地,真菌病原体属于门孢菌属(Setosphaeria)、平脐蠕孢属(Bipolaris)、柄锈属(Puccinia)或双孢属(Diplodia)的属,更优选地为以下的物种:大斑病长蠕孢、Setosphaeria rostrate、Setosphaeriaglycinea、Setosphaeria holmii、Setosphaeria khartoumensis、小毛球腔菌(Setosephaeria minor)、Setosphaeria monoceras、Setosphaeria pedicellata、Setosphaeria prolata、南极光平脐蠕孢(Bipolaris australis)、Bipolaris brizae、布氏平脐蠕孢(Bipolaris)、Bipolaris cactivora、克氏平脐蠕孢(Bipolarisclavata)、薏苡平脐蠕孢(Bipolaris coicis)、Bipolaris colocasiae、Bipolariscrotonis、甲壳纲平脐蠕孢(Bipolaris crustacean)、圆柱平脐蠕孢(Bipolariscylindrical)、Bipolaris euchlaenae、Bipolaris halepensis、橡胶树平脐蠕孢(Bipolaris heveae)、Bipolaris incurvata、籼平脐蠕孢(Bipolaris indica)、Bipolarisiridis、Bipolaris leersiae、Bipolaris micropus、Bipolaris miyakei、Bipolarismultiformis、尼科平脐蠕孢(Bipolaris nicotiae)、Bipolaris novae-zelandiae、Bipolaris ovariicola、稷平脐蠕孢(Bipolaris panici-miliacei)、弯曲平脐蠕孢(Bipolaris papendorfii)、甘蔗平脐蠕孢(Bipolaris sacchari)、Bipolarissalkadehensis、高粱生平脐蠕孢(Bipolaris sorghicola)、Bipolaris subpapendorfii、Bipolaris tropicalis、Bipolaris urochloae、Bipolaris zeae、天门冬属柄锈菌(Puccinia asparagi)、禾柄锈菌(Puccinia graminis)、堀柄锈菌(Puccinia horiana)、Puccinia mariae-wilsoniae、Puccinia poarum、Puccinia psidii、Puccinia recondite、Puccinia sessilis、高粱柄锈菌(Puccinia sorghi)、条形柄锈菌(Pucciniastriiformis)、小麦叶锈菌(Puccinia triticina)、Diplodia maydis、Diplodia seriata或大孢色二孢(Stenocarpella(Diplodia)macrospora),最优选是大斑病长蠕孢、高粱柄锈菌、大孢色二孢或玉米小斑病菌(Bipolaris maydis)。
在一实施方案中,植物病害是真菌病。在一个优选的实施方案中,植物病害选自由以下组成的组:北方玉米叶枯病(由大斑病长蠕孢引起)、南方玉米叶枯病(由玉米小斑病菌引起)、常见锈病(由高粱柄锈菌引起)和Diplodia Leaf Streak(由大孢色二孢(也称为Stenocarpella macrospora)引起)。最优选地,植物病害是北方玉米叶枯病(NCLB)。
在一个优选的实施方案中,本发明的核酸分子编码能够赋予植物(或在植物中增加)对北方玉米叶枯病(NCLB)的抗性,即针对大斑病长蠕孢的抗性,特别是针对大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N的抗性或针对大斑病长蠕孢小种0、1和/或N的抗性的多肽。
在一个实施方案中,根据本发明的植物是大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italic)、小粒稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、紫短柄草(Brachypodium distachyon)、海滨大麦(Hordeummarinum)、节节麦(Aegilops tauschii)、Daucus glochidiatus、甜菜属(Beta spp.)包括甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、胡萝卜(Daucuscarota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、烟草(Nicotiana tabacum)、本氏烟草(Nicotianabenthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、螺旋狸藻(Genliseaaurea)、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、喜马拉雅鼠耳芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursapastoris)、Olmarabidopsis pumila、筷子芥(Arabis hirsute)、欧洲油菜(Brassicanapus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥(Brassica nigra)、Eruca vesicaria subsp.sativa、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago truncatula)、山下鹰嘴豆(Cicer yamashitae)、Cicer bijugum、鹰嘴豆(Cicer arietinum)、网状鹰嘴豆(Cicer reticulatum)、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotusjaponicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Allium tuberosum),或属于上述植物之一的任何变种或亚种,更优选为大麦、球茎大麦、双色高粱、玉米、小米、小粒稻、水稻、澳洲野生稻、高秆野生稻、普通小麦、硬粒小麦、黑麦、黑小麦、海滨大麦、节节麦,或属于上述植物之一的任何变种或亚种,最优选为大麦、双色高粱、玉米、普通小麦、黑麦,或属于上述植物之一的任何变种或亚种,。
在一个优选的实施方案中,根据本发明的植物是玉米。
优选地,根据本发明的核酸分子编码多肽,其是壁相关受体样激酶1(WAK RLK1)或功能上属于壁相关受体样激酶1的家族。
在另一方面,提供了包含本发明的核酸分子的载体。载体可以是质粒、粘粒、噬菌体或表达载体、转化载体、穿梭载体或克隆载体,它可以是双链或单链、线性或环状,或者它可以是原核或真核宿主,通过整合入其基因组或染色体外转化。
还提供了表达盒,其包含本发明的核酸分子。
在一个实施方案中,在载体或表达盒中,本发明的核苷酸序列可操作地连接至调控元件,这允许核苷酸序列在植物细胞中表达。所述植物细胞可以是可被真菌病原体感染的或是被真菌病原体感染的。在一个优选的实施方案中,所述植物细胞位于叶或叶组织中。调控元件可以是启动子(天然、合成、核心启动子或嵌合启动子)、终止子、增强子或顺式作用元件。此外,调控元件可以与可操作地连接至调控元件的核苷酸序列异源。
优选地,本发明的核苷酸序列在表达载体中可操作地连接至一个或多个调控序列,所述调控序列允许在原核或真核宿主细胞中转录和任选地表达。例如,核苷酸序列可以在合适的启动子或终止子的控制下。合适的启动子可以是组成型诱导的启动子(参见例如,来自“花椰菜花叶病毒”的35S启动子(Odell JT,Nagy F,Chua N-H(1985)“Identificationof DNA sequences required for activity of the cauliflower mosaic virus 35Spromoter.”Nature 313,810–812 1985);其他例子是水稻的肌动蛋白启动子(SEQ ID NO:43)或二穗短柄草(Brachypodium distachyon)的EF1启动子(SEQ ID NO:44)。特别合适的启动子是那些是病原体诱导型的启动子(参见例如,来自欧芹的PR1启动子(Rushton PJ,Torres JT,Parniske M,Wernert P,Hahlbrock K und Somssich IE(1996)Interactionof elicitor-induced DNA-binding proteins with elicitor response elements inthe promoters of parsley PR1 genes.EMBO J.15(20):5690–5700)。特别合适的病原体诱导型启动子是自然界中不存在的合成启动子或嵌合启动子,其由几个元件组成并且包含最小的启动子,以及在最小启动子的上游的至少有一个顺式调控元件,所述至少有一个顺式调控元件充当特殊转录因子的结合位点。嵌合启动子是定制设计的,并由多种因素诱导或重新引发。此类启动子的实例可见于WO2000/29592和WO2007/147395。合适的终止子的例子是nos终止子(Depicker A,Stachel S,Dhaese P,Zambryski P,Goodman HM(1982)Nopaline synthase:transcript mapping and DNA sequence.J Mol Appl Genet.1(6):561-73)。
进一步提供了包含本发明的核酸分子、或本发明的载体或本发明的表达盒的宿主细胞。
载体或表达盒可以例如通过缀合、动员、基因枪转化、农杆菌赋予的转化、转染、转导、真空渗入或电穿孔被引入宿主细胞。这种类型的方法以及所述载体的制备方法是本领域技术人员所熟悉的(Sambrook et al.,Molecular Cloning,Cold Spring HarborLaboratory,3rd Ed.,2001)。
在一实施方案中,宿主细胞可以是原核细胞(例如细菌细胞)。在另一个实施方案中,宿主细胞可以是真核细胞(例如,植物细胞或酵母细胞)。特别优选的细菌宿主细胞是根癌农杆菌、发根农杆菌和大肠杆菌。
在另一方面,提供了由本发明的核酸分子编码的蛋白质。
在另一方面,提供了植物,其包含本发明的核酸分子、本发明的载体、本发明的表达盒或本发明的蛋白质。该植物可以是转基因植物或基因编辑的植物。还提供了本发明的植物的一部分、本发明的植物的植物细胞和本发明的植物的种子,其中所述种子包含转基因的或内源的本发明的核酸分子、本发明的载体、本发明的表达盒或本发明的多肽。
从研究和使用具有来自Pepitilla的Htn1的渗入系的WO2015/032494中,已知该静止基因座与携带连锁累赘的基因组区域紧密连锁,导致对一个或多个农学特征的负面影响。对HT2侧翼区域的首次研究表明,这种或类似的连锁累赘不仅存在于用于HtN1渗入的Pepitilla供体中,而且还存在于该长蠕孢抗性基因座(如A619)的其他供体中。尤其是作为HT2渗入的一部分的连锁累赘可以影响开花时间的差异,这是重要的农学特性。它可以直接且实质性地影响玉米植物的产量潜力。开花时间延迟通常会导致产量下降。影响产量潜力,特别是青贮饲料产量潜力的进一步连锁累赘,可能在玉米中的bin 8.06上的长蠕孢抗性基因座的远端和/或近端找到。与该抗性基因座紧密连锁的侧翼区域可能是已知连锁累赘的载体,但是,这些区域可以限于位于标记SYN14136和标记MA0021的等位基因之间的区间和/或位于标记MA0022和标记SYN4196的等位基因之间的区间(图6)。因此,本发明的植物可以是内源地包含本发明的核酸分子的玉米物种的植物,其中基因组中的侧翼区域不包含位于标记SYN14136和标记MA0021的等位基因之间的A619HT2或A619HT3衍生的区间,或位于标记MA0022和标记SYN4196的等位基因之间的A619HT2或A619HT3衍生的区间。在一个优选的实施方案中,植物是玉米物种的植物,其内源性地包含本发明的核酸分子,其中基因组中的侧翼区域不包含位于标记SYN14136和标记PZE108077560的等位基因之间的A619HT2或A619HT3衍生的区间,或位于标记PZE108093423和标记MA0021的等位基因之间的A619HT2或A619HT3衍生的区间,或位于标记MA0022和标记SYN4196的等位基因之间的A619HT2或A619HT3衍生的区间。
表2:KASP标记引物序列和供体等位基因的分配(等位基因X和等位基因Y:描述SNP的双等位基因值)
例如,可以在两个玉米植物之间的杂交过程中通过基因重组来去除连锁累赘,其中一个亲本玉米植物携带HT2抗性基因座。除了使用常规的育种技术来产生基因重组,其结果是将至少一个具有上面鉴定的连锁累赘的供体区间替换为轮回亲本的基因组序列(优选没有不需要的基因),现代生物技术给本领域技术人员提供许多工具,所述工具可以允许待进行的精确的基因工程。已知工具的示例是大范围核酸酶(Silva等,2011)、归巢核酸内切酶(Chevalier 2002)、锌指核酸酶、TALE核酸酶(WO 2010/079430;WO 2011/072246)或CRISPR系统(Gaj等人,2013)。这些是人工核酸酶融合蛋白,其能够切割双链核酸分子,例如植物DNA,并从而能够在基因组中的期望的位置产生双链断裂。通过利用细胞自身修复诱导的双链断裂的机制,可以进行同源重组或“非同源末端连接”,这可能导致携带连锁累赘的供体的区间的去除。可以从例如SNP标记的序列信息(表2)获得基因组中用于识别结构域核酸酶的合适靶序列。然而,本领域技术人员还能够鉴定其他序列,优选在上述限定的侧翼区域内,其适合作为核酸酶的识别结构域的靶序列。
在另一方面,提供了基因编辑的或转基因的植物,其包含本发明的核酸分子、本发明的载体或本发明的表达盒。核酸分子可以是转基因的或修饰的/编辑的内源基因。启动子可以可操作地连接至核酸分子或核苷酸序列用于表达。
还提供了包含本发明的核酸分子、本发明的载体或本发明的表达盒的本发明的植物的部分或种子,其中所述种子包含本发明的核酸分子、本发明的载体、本发明的表达盒。核酸分子可以是转基因的或修饰的/编辑的内源基因。
根据另一个方面,提供了鉴定或选择具有对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的真菌病原体引起的植物病害的抗性增强的植物,优选玉米物种的植物、或其部分、细胞或种子的方法或过程,所述方法或过程包括以下步骤:(a)在植物、或其部分、细胞或种子中(或在植物、或其部分、细胞或种子的样品中)检测如上所述的本发明核酸分子的存在,或选自由以下组成的组的核苷酸序列组成的核苷酸序列的存在:(i)与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)的核苷酸序列,(ii)编码与SEQ ID NO:3所示的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)的氨基酸序列的核苷酸序列,(iii)与SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列的核苷酸第1-920位(外显子1;SEQ ID NO:6)具有至少85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)的核苷酸序列,和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23252-23288位(外显子2;SEQ ID NO:7)具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)或与SEQ ID NO:2所示核苷酸序列的核苷酸第921-957位(外显子2;SEQ ID NO:7)具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)的核苷酸序列,和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23586-24632位(外显子3;SEQID NO:8)具有至少98%、98.5%、99%或99.5%的相同性(优选在全长上)或与SEQ ID NO:2所示核苷酸序列的核苷酸第958-2004位(外显子3;SEQ ID NO:8)具有至少98%、98.5%、99%或99.5%的相同性(优选在全长上)的核苷酸序列,(iv)编码与SEQ ID NO:3所示的氨基酸序列的第1-306位具有至少75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)和/或与SEQ ID NO:3所示的氨基酸序列的第307-319位具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)和/或与SEQ ID NO:3所示氨基酸序列的第320-668位具有至少98%、98.5%、99%或99.5%的相同性(优选在全长上)的氨基酸序列的核苷酸序列,其中(i)至(iv)中任一项的核酸分子编码能够在其中表达所述多肽的植物中,优选在其中表达所述多肽的玉米物种的植物中,赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性的多肽,并且其中优选地,(i)至(iv)中任一项的核酸分子编码这样的多肽,所述多肽是壁相关受体样激酶1(WAK RLK1)的家族或在功能上属于壁相关受体样激酶1(WAK RLK1)的家族;或在植物或其部分、细胞或种子中(或植物样品或其部分、细胞或种子中)检测由上述本发明核酸分子或(i)至(iv)中任一项的核苷酸序列编码的多肽,和(b)鉴定或选择植物或其部分、细胞或种子,在所述植物或其部分、细胞或种子中存在(a)中定义的核酸分子,其具有对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性或增加的抗性。
所述方法可以包括额外的步骤,即从植物或部分、细胞或种子获得核酸样品并检测样品中的序列。例如,可以在检测步骤(a)之前进行从植物或其部分或种子获得核酸样品的步骤。
核苷酸序列的检测可以使用寡核苷酸探针通过杂交方法进行。杂交条件可以根据例如所使用的探针的Tm值和靶DNA的CG含量的因素适当选择。已知的杂交方法描述于例如Sambrook等,2001。
可选地,基因的检测可以使用相应的引物通过DNA扩增方法的手段(例如PCR)来进行。当通过PCR方法进行检测时,可以根据诸如所使用的引物的Tm值和待检测的扩增区域的长度的因素适当地选择PCR条件。可以通过PCR扩增靶标并确认PCR扩增的产物的存在或不存在来进行检测。用于确认扩增产物的存在或不存在的方法没有特别限制。例如,可以通过对核酸扩增的反应混合物进行琼脂糖凝胶电泳来确认扩增产物;此后,用适当的核酸染色剂如溴化乙锭、SYBER Green I等对凝胶染色;并且检测由用紫外线的照射导致的条带的存在或不存在。条带可以通过视觉观察来检测,或者它们可以通过使用例如荧光图像分析仪等来检测。
进一步提供了鉴定对由真菌病原体,大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害具有增加的抗性并内源包含本发明的核酸分子的植物,优选玉米物种植物、其细胞或种子的方法或过程,所述方法或过程包括在植物等位基因中检测至少两个标记,其中至少一个所述标记在SYN14136和本发明的核酸分子之间的染色体区间上或在SYN14136和本发明的核酸分子之间的染色体区间内,以及至少一个所述标记在本发明的核酸分子和SYN4196之间的染色体区间上或在本发明的核酸分子和SYN4196之间的染色体区间内。在一个优选的实施方案中,所述方法或过程包括在植物等位基因中检测至少两个标记,其中至少一个所述标记在PZE108093423和本发明的核酸分子之间的染色体区间上或在PZE108093423和本发明的核酸分子之间的染色体区间内,以及至少一个所述标记在本发明的核酸分子和SYN4196之间的染色体区间上或在本发明的核酸分子和SYN4196之间的染色体区间内。
在另一方面,提供了鉴定这样的抗性基因的等位基因的方法,所述抗性基因在玉米中赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性,以及优选地编码壁相关受体样激酶1(WAK RLK1)的家族的多肽或在功能上属于壁相关受体样激酶1(WAK RLK1)的家族的多肽,其中该方法包括以下步骤步骤:(a)使用(i)至少一个从玉米基因型分离的编码核苷酸序列进行序列比较,其中所述核苷酸序列优选地定位于bin8.05抗性基因座或bin8.06抗性基因座,和(ii)作为参考序列,本发明的核苷酸序列,优选SEQ ID NO:1或SEQ IDNO:2所示的核苷酸序列或编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列,或其部分,或衍生自至少两个核苷酸序列的组的共有序列,其中一个核苷酸序列是本发明的核苷酸序列,优选SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列或编码SEQ ID NO:3所示氨基酸序列的核苷酸序列,或其部分,并且其中所述至少两个核苷酸序列的组的每个核苷酸序列编码能够在其中表达所述多肽的玉米中赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害的抗性,并优选定位于bin 8.05抗性基因座或bin 8.06抗性基因座,并优选编码是壁相关受体样激酶1(WAK RLK1)的家族或在功能上属于壁相关受体样激酶1(WAK RLK1)的家族的多肽;以及(b)如果序列比较显示以下则鉴定等位基因:(i)在核苷酸水平上这样的序列相同性:与SEQ ID NO:1或SEQ ID NO:2所示核苷酸序列的核苷酸第1-920位具有至少85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上),和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23252-23288位具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)或与SEQ ID NO:2所示核苷酸序列的核苷酸第921-957位具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上),和/或与SEQ ID NO:1所示核苷酸序列的核苷酸第23586-24632位具有至少98%、98.5%、99%或99.5%的相同性(优选在全长上)或与SEQ ID NO:2所示核苷酸序列的核苷酸第958-2004位具有至少98%、98.5%、99%或99.5%的相同性(优选在全长上),和/或(ii)在编码的氨基酸水平上这样的序列相同性:与SEQ ID NO:3所示氨基酸序列的第1-306位具有至少75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)和/或与SEQ ID NO:3所示的氨基酸序列的第307-319位具有至少60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、98%、99%或99.5%相同性(优选在全长上)和/或与SEQ ID NO:3所示的氨基酸序列的第320-668位具有至少98%、98.5%、99%或99.5%的相同性(优选在全长上)。
优选地,共有序列衍生自至少两个核苷酸序列的组,其中一个核苷酸序列是本发明的核苷酸序列,优选为SEQ ID NO:1或SEQ ID NO:2所示的核苷酸序列或编码SEQ ID NO:3所示的氨基酸序列的核苷酸序列或其部分,并且其中另外的核苷酸序列选自由以下组成的组:SEQ ID NO:9所示的核苷酸序列或其部分、SEQ ID NO:11所示的核苷酸序列或其部分、SEQ ID NO:13所示的核苷酸序列或其部分、SEQ ID NO:23所示的核苷酸序列或其部分、编码SEQ ID NO:10所示的氨基酸序列的核苷酸序列或其部分、编码SEQ ID NO:12所示的氨基酸序列的核苷酸序列或其部分、编码SEQ ID NO:14所示的氨基酸序列的核苷酸序列或其部分、或编码SEQ ID NO:24所示氨基酸序列的核苷酸序列或其部分。
从步骤(a)(i)的玉米基因型分离的至少一个编码核苷酸序列可以衍生自植物序列数据库或衍生自基因库,在所述基因库中保藏有多种玉米基因型的种子样品。植物序列数据库或基因库是本领域已知的。
鉴定赋予对由真菌病原体引起的植物疾病的抗性或增加的抗性的抗性基因的(新的)等位基因(或抗性基因的潜在的新的等位基因)的方法可以进一步包括例如作为步骤(c),确定由鉴定出的等位基因引起的植物针对真菌病原体的抗性水平的步骤。
进一步提供了核酸分子,其包含通过上述鉴定方法鉴定的抗性基因的等位基因(或潜在的新等位基因)的核苷酸序列或由通过上述鉴定方法鉴定的抗性基因的等位基因(或潜在的新等位基因)的核苷酸序列组成。所述等位基因可用于产生植物,优选玉米物种的植物的方法中,或用于赋予/增加对由真菌病原体例如大斑病长蠕孢,优选由大斑病长蠕孢小种0、1、2、3,N,12、23、2N,12N,23N和/或123N引起的植物病害的抗性的方法中。在一个实施方案中,根据本发明的产生植物的方法或根据本发明的赋予/增加对植物病害的抗性的方法进一步在步骤(a)包括引入至少一个包含或由以下组成的核酸分子:在植物的至少一个细胞中编码新抗性基因的核苷酸序列。
在另一个方面,提供了在植物中,优选在玉米物种的植物中,赋予或增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性,包括以下步骤:(a)将本发明的核酸分子、本发明的表达盒或本发明的载体引入植物的至少一个细胞中,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,(b)从所述至少一个细胞再生植物,和(c)在植物中引起所述核酸分子的表达。
在赋予或增加对由真菌病原体引起的植物病害的抗性的方法的优选实施方案中,步骤(a)导致赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害敏感性的内源性核酸分子的修饰,所述内源性核酸分子优选定位至玉米的8号染色体上的bin 8.05抗性基因座或bin 8.06抗性基因座,并且优选编码于壁相关受体样激酶1(WAK RLK1)家族的多肽或在功能上属于壁相关受体样激酶1(WAK RLK1)家族的多肽,其中所述修饰将内源性核酸分子转化为赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性的本发明的核酸分子(如果表达的话)。
在赋予或增加对由真菌病原体引起的植物病害的抗性的方法的另一个优选实施方案中,步骤(a)导致赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性的内源性核酸分子的修饰,所述内源性核酸分子优选定位至玉米的8号染色体上的bin 8.05抗性基因座或bin8.06抗性基因座,并且优选编码于壁相关受体样激酶1(WAK RLK1)家族的多肽或在功能上属于壁相关受体样激酶1(WAK RLK1)家族的多肽,其中所述修饰将内源性核酸分子转化为赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的增加的抗性的本发明的核酸分子(如果表达的话)。
进一步提供了一种在本发明的植物中增加对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性的方法,包括在植物或植物的至少一个细胞中降低本发明的核酸分子、本发明的表达盒或本发明的载体的表达水平的步骤,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,优选与抗性野生型植物中内源基因的表达水平相比。这种抗性野生型植物例如选自株系A619HT2、B37HT2或B73HT2。降低可瞬时或持久地进行,如果是被预期中的真菌病原体(例如由于特定的环境条件导致真菌病原体的分布)侵染,则优选作为预防措施。本领域技术人员非常了解减少植物中基因表达的各种方法。表达水平的持久降低可以例如通过以下实现:通过调节启动子或其他调控元件、通过随机或定向诱变的方式、或通过稳定整合表达盒,所述通过稳定整合表达盒允许表达双链RNA、单链反义RNA或发夹DNA,它们能够作为干扰RNA沉默本发明的核酸分子编码的mRNA。这种抑制性RNA分子,优选地以siRNA分子的形式,如果作为喷雾应用于植物并被植物细胞,优选叶细胞主动或被动地吸收,也可以用于瞬时降低表达水平。
在另一方面,提供了产生植物,优选玉米物种的植物,或其部分、细胞或种子的方法,所述植物具有对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的(增强的)抗性,包括以下步骤:(a)将本发明的核酸分子、本发明的表达盒或本发明的载体引入植物中或植物的至少一个细胞中,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,(b)任选地,从所述至少一个细胞再生植物;和(c)在植物中引起所述核酸分子的表达。
在产生玉米物种的植物(或其部分、细胞或种子)的方法的一个优选实施方案中,步骤(a)导致赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的敏感性的内源性核酸分子的修饰,所述内源性核酸分子优选定位至玉米的8号染色体上的bin 8.05抗性基因座或bin 8.06抗性基因座,并且优选编码于壁相关受体样激酶1(WAK RLK1)家族的多肽或在功能上属于壁相关受体样激酶1(WAK RLK1)家族的多肽,其中所述修饰将内源性核酸分子转化为赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性的本发明的核酸分子。
在产生玉米物种的植物(或其部分、细胞或种子)的方法的另一个优选实施方案中,步骤(a)导致赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的抗性的内源核酸分子的修饰,所述内源性核酸分子优选定位至玉米的8号染色体上的bin 8.05抗性基因座或bin 8.06抗性基因座,并且优选编码于壁相关受体样激酶1(WAK RLK1)家族的多肽或在功能上属于壁相关受体样激酶1(WAK RLK1)家族的多肽,其中所述修饰将内源性核酸分子转化为赋予对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害的增加的抗性的本发明的核酸分子。
优选地,所述方法用于产生对由真菌病原体,例如大斑病长蠕孢,优选地由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害具有增强的抗性的植物(或其部分、细胞或种子)。因此,所述方法可以包括选择与参考植物相比具有增加的抗性的植物的额外的步骤(d)。优选地,所述参考植物是相同物种的植物,更优选地,所述参考植物是相同物种的野生型植物或与步骤(d)中选择的植物同基因的植物,期望为如上所述在步骤(a)中引入或在步骤(a)过程中修饰的本发明的核酸分子。
优选地,在本发明的方法中,本发明的核酸分子在植物或其部分中以足以在植物中增加或赋予对真菌病原体引起的植物病害的抗性的量和/或时长表达。
在另一方面,提供了通过本发明的方法产生的植物,或其后代、果实或种子。优选地,所述植物或其后代、果实或种子包含本发明的核酸分子或本发明的载体或本发明的蛋白质和/或本发明的细胞。
在另一方面,提供了至少一个本发明的核酸分子在产生对由真菌病原体,例如大斑病长蠕孢,优选地由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N引起的植物病害具有增强的抗性的植物中的用途,所述核酸分子包括例如包含所鉴定的抗性基因的新等位基因的核苷酸序列或由所鉴定的抗性基因的新等位基因的核苷酸序列组成。产生的植物可以是基因编辑的或转基因的植物。
进一步提供了控制真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1、2、3、N、12、23、2N、12N、23N和/或123N的侵染的方法,包括以下步骤:(a)在农业和园艺领域中生长本发明的植物,和(b)在植物中引起本发明的核酸分子、本发明的表达盒或本发明的载体的表达,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成。
本发明的另一方面是长度至少为15、16、17、18、19或20,优选至少为21、22、23、24或25,更优选至少为30、35、40、45、50、100、200、300或500个核苷酸的寡核苷酸,其中所述寡核苷酸能够与以下杂交或退火:(i)本发明的核酸分子,(ii)包含SEQ ID NO:4或SEQ IDNO:5的核苷酸序列的核酸分子,或(iii)与(i)或(ii)互补的核酸分子。优选地,所述寡核苷酸包含所述寡核苷酸能够与之杂交或退火的(i)、(ii)或(iii)的核酸分子的核苷酸序列具有至少90%、92%、94%、95%、96%、97%、98%、98.5%、99%、99.5%或100%相同性的核苷酸序列。
进一步提供了寡核苷酸对或包含所述寡核苷酸的试剂盒,其中所述寡核苷酸适合于作为正向引物和反向引物退火至植物基因组(优选是玉米基因组)中的区域,其显示出与本发明的核酸分子共分离,优选完美的共分离。优选地,所述对包含本发明的一个或两个寡核苷酸。优选地,所述试剂盒包含本发明的一个、两个或更多个寡核苷酸。
在另一方面,提供了至少一种寡核苷酸作为分子标记或其部分在鉴定或选择对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害具有增强的抗性的植物,优选玉米物种的植物,或其部分、细胞或种子的方法中的用途,或在鉴定在玉米中赋予或增强对由真菌病原体,优选由大斑病长蠕孢,更优选由大斑病长蠕孢小种0、1和/或N引起的植物病害具有增强的抗性的方法中的用途,其中所述分子标记能够检测至少一个单核苷酸多态性、缺失或插入诊断用于本发明核酸分子和/或包含如上所述的寡核苷酸和/或是如上所述的寡核苷酸对或试剂盒。这种单核苷酸多态性、缺失或插入可以直接衍生自图2所示的序列比对。优选地,所述至少一个单核苷酸多态性、缺失或插入导致至少一个氨基酸的交换、缺失或插入。赋予如WO2015/032494中所公开的“Pepitilla”抗性表型的,来自具有SEQ ID NO:3所示氨基酸序列的多肽与RLK1多肽(SEQ ID NO:10)之间的比较的特征性氨基酸交换、缺失或插入,如表2所示。
在另一个方面,提供了用于在植物,优选在玉米物种的植物中,检测本发明的核酸分子的存在或不存在的方法,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,所述方法包括以下步骤:(a)从植物的至少一个细胞中分离DNA,和(b)使用分子标记来检测本发明的核酸分子的存在或不存在,其中所述分子标记能够检测至少一个单核苷酸多态性、缺失或插入诊断用于本发明的核酸分子和/或包含如上所述的寡核苷酸和/或是如上所述的寡核苷酸对或试剂盒。
一方面,提供了至少一个或至少两个寡核苷酸作为分子标记或其部分在如上所述的鉴定植物的方法或过程中或在消除与本发明的核酸分子紧密连锁的连锁累赘的方法或过程中的用途,用于检测位于标记SYN14136和标记MA0021的等位基因之间的A619HT2或A619HT3衍生的区间或位于标记MA0022和标记SYN4196的等位基因之间的A619HT2或A619HT3衍生的区间的存在或不存在。在一个优选的实施方案中,在消除与本发明的核酸分子紧密连锁的连接累赘的方法或过程中,至少一个寡核苷酸被用作分子标记或其部分,用于检测以下存在或不存在:位于标记SYN14136和标记PZE108077560的等位基因之间的A619HT2或A619HT3衍生的区间、位于标记PZE108093423和标记MA0021的等位基因之间的A619HT2或A619HT3衍生的区间和/或位于标记MA0022和标记SYN4196的等位基因之间的A619HT2或A619HT3衍生的区间。
在另一个方面,提供了用于在植物,优选在玉米物种的植物中,检测本发明的核酸分子的存在或不存在的方法,所述核酸分子包括例如包含所鉴定的等位基因的核苷酸序列或由所鉴定的等位基因的核苷酸序列组成,所述方法包括以下步骤:(a)从植物的至少一个细胞中分离DNA,和(b)使用分子标记来检测本发明的核酸分子的存在或不存在,其中所述分子标记能够检测至少一个单核苷酸多态性、缺失或插入诊断用于本发明的核酸分子和/或包含如上所述的寡核苷酸和/或是如上所述的寡核苷酸对或试剂盒。这种单核苷酸多态性、缺失或插入可以直接衍生自图2所示的序列比对。优选地,所述至少一个单核苷酸多态性、缺失或插入导致至少一个氨基酸的交换、缺失或插入。赋予如WO2015/032494中所公开的“Pepitilla”抗性表型的,来自具有SEQ ID NO:3所示氨基酸序列的多肽与RLK1多肽(SEQID NO:10)之间的比较的特征性氨基酸交换、缺失或插入,如表3所示。
表3:赋予如WO2015/032494中所公开的“Pepitilla”抗性表型的,来自具有SEQ IDNO:3所示氨基酸序列的多肽与RLK1多肽(SEQ ID NO:10)之间的比较的特征性氨基酸交换、缺失或插入(也参见图3)。
/>
定义
针对病原体的表述“抗性”或“抗性的”应理解为是指植物或植物细胞抵抗病原体的破坏作用并从延迟疾病发展延伸至对疾病发展的完全阻抑的能力。所述抗性可以是完全的或者是部分的并且可以对病原体小种是特异性的或者非特异性的。赋予的抗性可以是新遗传的抗性或者是已经存在的部分抗性的提升。
可以通过本领域已知的方法来定量抗性。例如,可以根据下表4中所示的方案,通过使用表型实验确定分类分数来量化对大斑病长蠕孢的抗性。例如,本发明意义上的抗大斑病长蠕孢的玉米植物以至少1个分类分数,优选至少2个分类分数或至少3个分类分数,并且最优选至少获得4个分类分数来表现出对大斑病长蠕孢的“增加的抗性”。优选地,根据本发明的玉米植物表现出对至少一个大斑病长蠕孢小种的抗性,其不对应于现有技术中已知的已知小种特异性。在一个特别优选的实施方案中,根据本发明的玉米植物对所有已知的大斑病长蠕孢具有抗性,即所赋予的抗性不是小种特异性的,并且在形成对大斑病长蠕孢的广泛抗性中可能是特别有利的。
表4:在自然和人工的大斑病长蠕孢接种下,在不同地点进行的田间试验中用于表型试验的分类评分方案(来自Deutsche Maiskomitee(DMK,German maize committee);AGvariety 27.02.02;(DMK J.Rath;RP Freiburg)HJ Imgraben)
术语“杂交”应理解为是指这样的过程,其中单链的核酸分子与尽可能互补的核酸链聚附(agglomerate),也即与其碱基配对。用于杂交的标准方法的实例已经在2001由Sambrook等人描述,优选地,这应理解为是指核酸分子的至少60%、更优选至少65%、70%、75%、80%或85%特别优选90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的碱基与尽可能互补的核酸链进行碱基配对。此种附聚的可能性取决于杂交条件的严格性。术语“严格性”是指杂交条件。高严格性是碱基配对更难的时候,低严格性是碱基配对更简单的时候。杂交条件的严格性取决于,例如盐浓度或离子强度和温度。一般来说,可以通过提高温度和/或通过降低盐含量来提高严格性。术语“严格的杂交条件”应理解为是指这样的条件,在该条件下杂交主要仅在同源核酸分子之间发生。术语“杂交条件”在此方面不仅仅是指核酸的实际附聚过程中占优势的实际条件,还是指随后的洗涤步骤中占优势的条件。高严格杂交条件的实例为,在该条件下主要仅有那些具有至少90%或至少95%的序列相同性的核酸分子才进行杂交。这样的高严格杂交条件例如是:于65℃4 x SSC以及随后在65℃0.1 x SSC多次洗涤大约1小时。术语“高严格杂交条件”如本文所用可以指:于68℃在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时并随后用2 x SSC和0.1%SDS于68℃洗涤两次。优选地,杂交在严格条件下进行。本发明涵盖包含编码蛋白质的核苷酸序列或由其组成的核酸分子,所述蛋白质衍生自由SEQ ID NO:1或SEQ ID NO:2的核苷酸序列编码的氨基酸序列或氨基酸序列通过取代,缺失和/或添加一个或多个氨基酸在SEQ ID NO:3中列出的“氨基酸”。在本文中,术语“一个或多个氨基酸”是指例如1至50、1至40、1至30或1至20,优选1至10,更优选1至7,进一步优选1-5个,特别优选1、2或3个氨基酸。较低严格的杂交条件为:例如于37℃4 x SSC中杂交以及随后在室温下于1 x SSC中多次洗涤。
“可操作地连接”是指在普通核酸分子中连接的方式,从而所连接的元件相对于彼此之间的位置和取向使得核酸分子的转录可以发生。与启动子可操作地连接的DNA处于此启动子的转录控制之下。
本发明中的“引入”包括通过转化的手段的稳定整合,所述转化包括农杆菌介导的转化、转染、显微注射、生物弹轰击、使用基因编辑技术如CRISPR系统(例如CRISPR/Cas,特别是CRISPR/Cas9或CRISPR/Cpf1),CRISPR/CasX或CRISPR/CasY),TALEN、锌指核酸酶或大范围核酸酶的插入,任选地通过上述基因编辑技术中的一种的手段进行同源重组(优选地包括修复模板)、使用随机或靶向的诱变(如TILLING或上述基因编辑技术等)修饰内源基因。术语“引入”可能包含或可能不涵盖使用常规育种的渐渗。
术语“转基因的(transgenic)”、“转基因的(transgenical)”或“转基因”应理解为是指相应的基因是引入植物中的外源基因。外源基因可以衍生自向其中引入该外源基因的植物物种以外的物种。可选地,相应的基因可以是已经在向其中引入该基因的植物物种中存在的基因,从而作为引入转基因的结果存在所述基因的一个或多个额外的拷贝。“转基因植物”是这样的植物,其基因组中已经整合了至少1个多核苷酸,优选是异源多核苷酸。优选地,所述多核苷酸已经以稳定的方式被整合,这意味着所整合的多核苷酸在植物中保持稳定、进行表达并且还可以稳定遗传至后代。将多核苷酸稳定引入至植物的基因组还包括整合至此前的亲代植物的基因组,其中所述多核苷酸可以稳定的方式进一步遗传。术语“异源”意思是,所引入的多核苷酸,源自例如具有相同物种的另一种遗传背景的细胞或者生物体或源自另一物种,或者是与原核的或真核的宿主细胞同源,但是却位于遗传环境中并因而与任何可能的相应天然发生的多核苷酸不同。在相应的内源基因之外还可以存在异源多核苷酸。
植物“器官”为叶、植物茎、茎、根、营养性芽、分生组织、胚、花药、胚珠或果实。植物“部分”可以表示若干器官的融合,例如花或种子或器官的一部分,例如来自茎的横切段。植物“组织”的实例有愈伤组织、软组织、分生组织、叶组织、芽组织、根组织、植物肿瘤组织和繁殖组织。术语“细胞”应理解为是指例如具有细胞壁的分离的植物细胞或其聚集物(aggregate)或原生质体。
术语“基因编辑的”是指内源基因被修饰,例如通过通过随机诱变、TILLING或基因编辑技术的手段。例如,根据本发明,可以修饰植物的内源基因以赋予对由真菌病原体引起的植物病害的抗性(或增加的抗性)。基因修饰可以例如使用随机或靶向的诱变(例如基因编辑)或同源重组(任选地,由基因编辑工具支持)或其组合的方法来实现。
如本文所用,“修饰”是指遗传序列已经改变了至少一个核苷酸。这可以通过替换至少一个核苷酸和/或缺失至少一个核苷酸和/或插入至少一个核苷酸来发生,只要与修饰之前的核苷酸序列相比导致至少一个核苷酸的总改变,从而允许修饰的鉴定,例如通过本领域技术人员将熟知的诸如测序或PCR分析等的技术。
术语“等位基因”是指在基因组中特定位置的一个或两个或更多个核苷酸序列。第一个等位基因在一染色体上,第二个在另一染色体上相同的位置。如果两个等位基因是不同的,则他们是杂合的,而如果他们是相同的则它们是纯合的。基因的各种等位基因(基因等位基因)至少在一个SNP上有差异。抗性基因的多种等位基因可以赋予植物针对真菌病原体的抗性,可能是抗性水平不同,即响应于真菌病原体的侵染而导致植物的不同表型类型,或者构成不能赋予抗性的该基因的变异体,即所得植物表型对真菌病原体易感。
根据本发明,术语“调控序列”是指影响表达特异性和/或强度的核苷酸序列,例如调控序列赋予特定的组织特异性。此类型的调控序列可位于最小启动子的转录起始点的上游,但也可以位于其下游,例如在转录的但却不翻译的前导序列中或者在内含子内。
“分子标记”或“标记”是用作参照或者定位点的核苷酸序列。用于识别重组事件的标记应当适宜用于监测植物群体中的差异或多态性。对于标记,这些差异是在DNA水平的,例如,是多核苷酸序列序列差异,如SSR(简单序列重复)、RFLP(限制片段长度多态性)、FLP(片段长度多态性)或者SNP(单核苷酸多态性)。所述标记可以源自基因组或者表达的核酸如经剪接的RNA、cDNA或EST,并且可以是基于用作探针或引物对的核酸,因而适宜于用基于PCR的方法来扩增序列片段。可以使用现有技术中已知的方法来检测涉及群体中不同部分之间遗传多态性的标记(An Introduction to Genetic Analysis.7th Edition,Griffiths,Miller,Suzuki等,2000)。这些包括例如:DNA测序、基于PCR的序列特异性扩增、RFLP的测定、多核苷酸多态性的测定(使用等位基因特异性杂交(ASH))、检测SSR、SNP或AFLP。用于检测EST(表达序列标签)和RAPD(随机扩增多态性DNA)的方法也是已知的。根据上下文,说明书中的术语“标记”也可以是指物种基因组中可以发现特定标记(例如SNP)的特定染色体位置。
术语“远侧”和“近侧”是描述染色体区间或遗传区段在整个染色体相对于特定参照点(例如特定的多核苷酸、另外的染色体区间或基因)的位置;“远侧”是指所述区间或所述区段位于参照点远离染色体着丝点的一侧,而“近侧”是指所述区间或所述区段位于参照点靠近染色体着丝点的一侧。
“紧密连锁”是指两个基因座、两个区间、两个遗传区段(例如抗性基因和侧翼区域)或两个标记(标记基因座)彼此之间距离小于15cM、小于12cM、小于10cM、小于8cM、小于7cM、小于6cM、小于5cM、小于4cM、小于3cM、小于2cM、小于1cM、小于0.5cM、小于0.2cM、小于0.1cM,这是通过公开可得自Maize GDB网站的IBM2Neighbors 4基因谱图确立的,或者彼此之间距离小于50Mbp(兆碱基对)、小于40Mbp、小于30Mbp、小于25Mbp、小于20Mbp、小于15Mbp或小于10Mbp。
术语“区间(interval)”或“染色体区间”是指基因组DNA上连续的线性区段,其通常存在于植物中的个体染色体中或者在染色体片段上,并且其通常由代表区间在远侧和近侧端点的两个标记所限定。在此方面,限定区间末端的标记其本身也可是所述区间的一部分。另外,两个不同的区间可重叠。在本说明书中,区间由表述“在标记A和标记B之间”来限定。区间的末端标记也可以位于区间一边的给定标记区内。继而可以通过提供两个旁侧的标记来限定标记区,并构成染色体区段(其上面在所述旁侧标记之外还可以有更多的标记)。旁侧标记确定标记区的端点且它们本身依然是标记区的一部分。如果区间两端的标记是区间两边不同标记区中的标记,则本说明书中通过如下来限定区间“在旁侧为标记C和D的标记区X中的标记与旁侧为标记E和F的标记区Y中的标记之间”。标记区可以长达500 000碱基对(bp),且优选大小在100 000至400 000bp之间,或者特别优选大小可以在140 000至315 000bp之间。
术语“渐渗(introgression)”如本发明所用是指遗传背景的遗传基因座上至少一个期望的等位基因转移至另一个。作为实例,特定基因座处期望的等位基因的渐渗可以通过相同物种的两个亲本之间的有性杂交来转移给后代。或者,例如,等位基因的转移也可以通过在融合的原生质中两个供体基因组之间的重组来发生,其中至少一个供体原生质在其基因组中携带有所期望的等位基因。在每种情形中,所述后代(其包含所期望的等位基因)可以再与包含优选遗传背景的品系回交并用于筛选期望的等位基因。结果是将期望的等位基因固定在选定的遗传背景中。
“基因座”是染色体上发现一个或多个基因(其引起或影响农学特征)的位置。具体而言,“基因座”如本文所用是指HT2-抗性基因座,其赋予针对病原体大斑病长蠕孢(或至少大斑病长蠕孢的一种)的抗性。
术语“等位基因”是指在基因组中特定位置的一个或两个或更多个核苷酸序列。第一个等位基因在一染色体上,第二个在另一染色体上相同的位置。如果两个等位基因是不同的,则他们是杂合的,而如果他们是相同的则它们是纯合的。基因的各种等位基因(基因等位基因)至少在一个SNP上有差异。根据本说明书的上下文,等位基因也是指单一的SNP,其例如使得可以区分抗性供体和轮回亲本。
实施例
下列实施例,包括进行的实验和获得的结果,仅用于说明目的,且不构成对本发明的限制。
1.抗性基因HT2和HT3的克隆和功能验证
a.QTL定位和重组体开发
将供体株系A619HT2与RP1系杂交并回交,以创建近等基因系(NIL,RP1HT2A),所述近等基因系具有位于8号染色体上的原始供体A619HT2的主要片段,并且很少有其他小的供体区。该NIL RP1HT2A与其轮回亲本RP1杂交形成F2种群。对RP2 x RP2HT3A进行相同的操作(此处原始供体为A619HT3)。回交亲本RP1和RP2对NCLB敏感(评分7-9;参见表4),而供体株系A619HT2和A619HT3有抗性(评分1-3)。NIL RP1HT2A和RP2HT3A的得分分别为2-3和1-2。
F2种群在德国Pocking地点的田间种植720株个体。QTL定位在8号染色体上的两个种群(1.1cM和3.5Mbp框)产生峰(具有RP2HT3A的种群的LOD值=168.77;具有RP1HT2A的种群的LOD值=44.02)。未检测到其他显著峰。重组植物(总数~2000)发展几代直到F11的状态。F2中的QTL定位以及重组物的进一步精细定位将染色体区域缩小至490kbp的物理区间(遗传区间=0.2cM)。该区间包括RLK1基因。
b.靶区域的分子分析
从株系RP1HT2A和RP2HT3A开发未固定的BAC文库,并用来自靶基因座的7个探针筛选。对于RLK1候选基因区域,可以为两个供体系开发连续的BAC重叠群。序列分析表明,供体系A619HT2和A619HT3对于靶区域是相同的(以1Mbp为单位)。候选基因RLK1 cDNA序列在携带WO 2015/032494 A2的HTN1和HT2等位基因的株系之间显示97个多态性(DNA水平;包括SNP和插入缺失(Indel)/缺失)和61个氨基酸变化(蛋白质水平)。在97个多态性中,只有14个单核苷酸多态性(SNP)导致沉默的氨基酸交换,这可能不会影响抗性基因的活性。所有其他多态性通过取代、添加或缺失显著改变蛋白质的结构。表3显示15个氨基酸交换,可以预测它们对蛋白质结构的强烈影响。其中,已鉴定出多种基因型特异性额外的氨基酸。与来自WO 2011/163590 A1中公开的供体系的SEQ ID NO:11和13所示的RLK1cDNA序列相比,A619HT2和A619HT3在31个核苷酸和12个氨基酸上不同。
c.RLK1的HT2等位基因的功能性验证
(i)使用EMS诱变的功能性验证:
开发来自RP2HT3A的EMS诱变的种群。筛选来自RLK1的外显子区1和3,并检测到3个携带氨基酸变化的阳性突变体(SEQ ID NO:16、18、20、46、48、50、52、54、56和58)。在突变体WVE16-92125-001的RLK cDNA中,在第1625位的G被A取代(也参见SEQ ID NO:15),导致在第542位从Gly至Asp的氨基酸交换(也参见SEQ ID NO:16);在突变体WVE16-92149-012的RLKcDNA中在第95位的D被T替换(也参见SEQ ID NO:17),导致在第32位从Pro至Leu的氨基酸交换(也参见SEQ ID NO:18);在突变WVE16-92168-005的RLK cDNA中在第115位G被A替换(也参见SEQ ID NO:19),导致在第39位从Ala至Thr的氨基酸交换(也参见SEQ ID NO:20);突变体WVE16-92168-024_WVE17-68687-013的RLK cDNA中在第73位G被A取代(也参见SEQ IDNO:45),导致在第25位从Ala至Thr的氨基酸交换(也参见SEQ ID NO:46);在突变体WVE17-68655-008的RLK cDNA中在第301位的C被T取代(也参见SEQ ID NO:47),导致在101位从Pro至Ser的氨基酸交换(也参见SEQ ID NO:48);在突变体WVE17-68625-014的RLK cDNA中在第715位的G被A取代(也参见SEQ ID NO:49),导致在第239位从Val至Ile的氨基酸交换(也参见SEQ ID NO:50);在突变体WVE17-68611-006的RLK cDNA中在第862位的T被A取代(也参见SEQ ID NO:51),导致在第288位从Phe至Ile的氨基酸交换(也参见SEQ ID NO:52);在突变体WVE17-68696-002的RLK cDNA中第929位的A被G取代(另见SEQ ID NO:53),导致在第310位从Lys至Arg的氨基酸交换(另见SEQ ID NO:54);在突变体WVE17-68656-011的RLK cDNA中在第1289位的C被T取代(也参见SEQ ID NO:55),导致在第430位从Thr至Ile的氨基酸交换(也参见SEQ ID NO:56);突变体WVE17-68630-001的RLK cDNA中第1826位的G被A取代(也参见SEQ ID NO:57),导致在第609位从Cys至Tyr的氨基酸交换(也参见SEQ ID NO:58)。这些突变体自交后,已在田间和温室中进行了评估。
d.表达分析:
在未感染和感染的叶片材料中RLK1在RP1、RP1HT2A、RP2和RP2HT3A中的表达分析表明,在NIL RP1HT2A和RP2HT3A中表达相似。在感染的叶片材料中该表达下调。对于RLK1的HTN1等位基因也可能显示出这种对感染的反应。
2.RLK1等位基因序列及抗性反应相关区域的鉴定
为了鉴定针对病原体大斑病长蠕孢的抗性反应的相关区域,进行了以下分析:对不同供体系和回交亲本中的RLK1基因的重测序的生物信息学分析揭示了与抗性反应相关的氨基酸区域。因此,已经开发出用于RLK1的基因组序列引物对以覆盖外显子区域。外显子1只能部分覆盖,且外显子2和3完全覆盖。扩增已开发的扩增子,并使用PACBio测序技术在96个基因型中测序。将该序列组配成每个基因型的共有序列。对于某些基因型,获得多个共有序列。选择具有最高量的测序读数的共有序列用于所有96个基因型的组配。根据外显子区域/部分确定单倍型。对于外显子1,检测到12个不同的单倍型;对于外显子2,检测到7个不同的单倍型;且对于外显子3,检测到9个不同的单倍型。在软件Lasergene MegAlign(DNASTAR,Inc.)中计算遗传距离。在DNA和蛋白质序列水平上组配不同的单倍型(参见表5)。结果,外显子1和2区域对于该基因而言似乎是高度可变的,并且携带与WAK相关的结构域。该蛋白质部分位于细胞间隙,并可能与真菌蛋白质相互作用。这两个外显子的差异是用于这种相互作用的有趣的候选碱基对。在此基础上,有可能在新的RLK1等位基因中鉴定外显子1和2的单倍型,它们至少能够赋予或增加对病原菌大斑病长蠕孢的抗性。
此外,对不同供体系、近等基因系和轮回亲本的表型和RLK1基因座的单倍型分析以及RLK1在不同供体系、等基因系和轮回亲本中的表达分析与表型分析相结合进行,用于鉴定抗性反应的相关区域,并最后鉴定抗性基因的新等位基因变体。评估所有描述的数据集应缩小抗性反应的相关区域。
表5:不同的基于外显子的单倍型之间的遗传距离[%]
在DNA水平的同源性 在蛋白质水平的同源性
总序列:>60% 总序列:>60%
外显子1:>85% 外显子1:>75%
外显子2:>60% 外显子2:>60%
外显子3:>98% 外显子3:>98%
3.对其他病原体的抗性反应
一组带有不同RLK1等位基因的基因型已接种了其他植物病原体,如玉米小斑病菌、高粱柄锈菌和大孢色二孢。这些病原体的共同特征是感染依赖于真菌的非常相似的生物学特性,以及依赖于它们通过叶组织穿透宿主的事实。南部玉米叶枯病(玉米小斑病菌)的第一个实验也表明RLK1的HT2等位基因和HTN等位基因的抗性反应。
4.通过农杆菌介导的转化,将对由大斑病长蠕孢引起的NCLB的抗性引入易感基因型
在具有不同活性的启动子下,具有HT2cDNA序列(SEQ ID NO:2)的三种不同构建体已被转化为易感玉米基因型A188:具有HT2cDNA序列(SEQ ID NO:2)、天然启动子区域1980bp(SEQ ID NO:4)和终止子区域(SEQ ID NO:5)的构建体A(载体p7U,见图1),具有HT2cDNA序列(SEQ ID NO:2)、水稻的肌动蛋白启动子(SEQ ID NO:43)和终止子区域(SEQID NO:5)的构建体B,以及具有HT2cDNA序列(SEQ ID NO:2)、二穗短柄草的EF1启动子(SEQID NO:44)和终止子区域(SEQ ID NO:5)的构建体C。为了产生例如载体p7U-nativeHT2_CDS_2,将含有在天然启动子和终止子控制下的HT2基因的表达盒转化至含有除草剂基因的二元载体中(例如:BASTA抗性、草甘膦抗性或ALS抑制剂抗性),用于随后转化到根癌农杆菌中用于农杆菌介导的植物转化至玉米基因型A188中。用不同的构建体稳定转化的T0植物已经繁殖,并测试了温室中生长的后代对NCLB的抗性。具有所有不同构建体的转基因植物显示出对NCLB的抗性增加,但是在不同程度上取决于整合的位置和启动子强度。
5.通过基因编辑将对由大斑病长蠕孢引起的NCLB的抗性引入易感基因型
已经鉴定了易感玉米基因型A188中的RLK1的等位基因,对其进行测序并预测cDNA(SEQ ID NO:21)。该A188等位基因的cDNA与HT2的cDNA之间的比较表明,该序列显示出99%的序列相同性(图4)。然而,在A188等位基因的1458至1459的位置处有2bp的插入“AC”,其导致在半胱氨酸之后的位置513处的提前的终止密码子(SEQ ID NO:22)。通过使用基于TALENS或CRISPR系统的基因编辑消除这2bp的插入,可以恢复基因型A188中的HT2抗性。图5显示了在由A188的修饰的RLK1等位基因衍生的RLK1蛋白(SEQ ID NO:24)与HT2等位基因之间的比对中氨基酸序列上的高度相同性。SEQ ID NO:23显示来自A188的修饰的RLK1等位基因的cDNA。
序列表
<110> 科沃施种子欧洲股份两合公司
苏黎世大学
<120> 赋予对真菌病原体抗性的基因
<130> KWS0267PCT
<150> EP 17187309.4
<151> 2017-08-22
<150> EP 17206305.9
<151> 2017-12-08
<160> 58
<170> PatentIn version 3.5
<210> 1
<211> 24632
<212> DNA
<213> Zea mays
<400> 1
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag taaagtcctg aaccgaccct cccttatttt tttttcattt 960
tttgcaatca ccagagcacg catcggttgc gtcagtatct tgcaacctcg tagctagccc 1020
cgcagtgtcc cctgtgtgcg agtaccgcgc tgctccagct tgcctcctgc taacgcctaa 1080
cggtgaatgc ttcatgcttg acatgatcta gctagtctac actttgcttg gggtttgcct 1140
gggagctgga aattctggct cctgtttgca tcactcgaca aggacgcttt cagacttgcg 1200
actctcgttc tgcttttgca ccaaatccgt gttttttcat ttcgtgatcg agattaatct 1260
agcgtagaga tgtcaatggg tatccgaaac tcgaaacccg atggattttt actctattag 1320
gtacaagttt gaatcaattt tcatatcata gatttgttaa taggcacaaa tctatatcca 1380
acaggttcat agatacgggt ttgttcctac agtaatcaaa tccgtaaacc catgagtttt 1440
ttagacccga ccaaacctag cgtatattgt cattttattt tataaacgaa caacaaaatt 1500
attatctctc tatttacttc ctattttttt atcggttggt gaatgtataa gtagttggtg 1560
agagtgttgc ttgcttgcta ttataatatt tagttattta ctagtgttat atatgtggtg 1620
gatggataac ttattgaaaa ggtcacttga ttatacaact tattatttgt attcattctt 1680
tctactaata atttttatat caaatcatga actcggtgtt tatcatataa attttggacc 1740
atgatcttat taatcatcac gatagttatt aattatgaga aaaacaaata tattggagat 1800
aaaaccctcg gctaacccgt taacccgatg ggcacgggtt tgaacaaaat ttcaaattta 1860
ttatgaatac aagtttttta acaaatatag atatgtttca tggatagagt ttgagatgac 1920
aaaatccaac ggatttgtat ccgttgccat ctctatccgg cggcccttac cgtgctccac 1980
gagcagaggt cgtatcgtcc ctcttcccgt gtcgcctgct tcgcgttgcc gaacggagac 2040
gtttggtagc gttggccggc tctagcagtc gggtcaattt ttttgttgtt gttttcgatg 2100
ttgttggatt tttgttccgt ataagccatg ttttggtaat ttatttagtc cagccgaatc 2160
cgaagacgtg tttgctgggt tggagacttt ggagttgcta gtcatgatat gctttctact 2220
cggtttgatt tcaacccagt taggctatat ttgatactct agtatttatt ccaatataaa 2280
tggtttgaaa gggattaaga tataaattag tttaatttat atctttaatt tctcttaacc 2340
catatgtatt gggctgaata ctaagtatca aaacaagccc ttatttaaga tgcattttct 2400
ttacagttac acgtggccac tattgtgtgg ggtaggccga tcctacttgt cagtgctcat 2460
tcgagagcaa agataccgaa ggagattaga gagactaaaa gctttttact atttaaaatt 2520
agataataag acgatttaat cccgttccat atctttgctc taaacaaacc ctcaatgatc 2580
atatatctcg gaagatccgg ccggctgttc tttatttatc aagtgatgac tgctgaccgc 2640
ttatagaata tatattttaa agcaaaattt cttctacatc agtaaaagga ctagacgaaa 2700
caatgatgca tttctctaac aaaagaaagt agaattatca agcggagagc caagaccaaa 2760
agccttacat ctatgggcgt caaccaatga taccgcgaac caccccagct ggtctatact 2820
gtctgtcacg acccagcgag taaccgtgtg gctacgctgt tagcttagga ttgaatgaaa 2880
tgctcggttc attaataaat cagctcacga gttaaatgat ttattatata acgaaactat 2940
atgcatatta tttaccaggg tgacgacagg gggcataggt gggcaatatc caccctaatg 3000
ctcctctaat tctataggga ttgttaattt atttagctaa ttatcatgta aacgatataa 3060
aaaatgtttc taacagcccc acggtccacc ctaatcttag accctagctt cgcctgttac 3120
gataaatatg ttatacatgt gtagtgtcta tgtcctatga attaaactaa tgattgatga 3180
actgtgctta tatattaaat tggtctatgc gaatataact atgtgttaaa ctgatgaaca 3240
tgtgtgtgaa ttgtgaattg ataagtgatg agttgtgtct aatttagtgt tatattgatg 3300
tgttttgtga aactatgagt ataattaata ttttctataa ttaaatttgt ttaaaattaa 3360
ctagaaattg attattatat atatatattg tttttctgct ctaattcgca agctaaacaa 3420
gcaagctcaa gctcgtaaac gagccgaacc gagctgactc tgtggctcat taacttaaca 3480
acccgagccg gaccaacttg ttagcttaac gagccagctc gaatacggac gagttgagcc 3540
gagctggcat gatatccagc cctaattagg ctcgtaccag tgcaacatat ccctctcgcc 3600
tttgtcacgt ccagacatgt caatgggccc cgattcccgc aaggaattcc tctattaagg 3660
gatgatgatg agaaagtttc tcccccacgg aaaaattctc tcctgacgca taaacgggga 3720
caacactcca catccccatt cctcgtgggg acctattaaa cttacatatg gtgatgtttt 3780
catgtaaaag ttaatgataa aaataaataa ttacgttgtc aagatatcac tttttgtaca 3840
aatgtgctca ttctgatgta gacatatttt ttcttacatc taacaatctg tatgagtgag 3900
aatgttttgt attaataaca aagtaagtat gttctaatta taatttaagc gggtccgggg 3960
atccccgatg gggatttata cccttgggaa acgaagatgg ggaagaaatg tcctacacaa 4020
gttttcatgg cgatcctcgc ggggaacttt ttcgtcgtgg ggatagggat ggggagctaa 4080
aacccgatga ggaattcctc gttgtcatcc ccagtcacgt caactctcga ctctactatt 4140
gtctctgctg catagtctgt ggtaaactat agcctcagcc tatagcacat cagcttttct 4200
atttcagaat taagtaattc atgcagtttt atttcaacgc tcgaaaatta cacaacataa 4260
tattttttat tgaattaaaa attataaagt gcatacaaat caataaaaat atattataat 4320
taaaacatat ataaatctaa tcggagacct cgatcttatc ctcgtcttcc accacctctt 4380
tttgttttgc ttctggttcc tcttcttcgt catcaaccag accacgtcct ttttcgaaca 4440
tctttatggc cttggcatgg gtttatcttt cagctaggtc catatccctg gttgaatggc 4500
tctttagagt attccattgc tttaaaagct tggtcttcac taatccaccc cacaagttct 4560
tcattttaaa tgcttcactt gttgactgtt gcttgtggct tccttccctt tccccttcac 4620
cttcatcttt cgcccagccg cctttgccct atcacgccct actgatcggg gcacttcctt 4680
cttggtatct ttagtgcctc cagaactata ttcactagag acactgagtc gggttatctt 4740
attcgtagtc ccattttatc ctagaacctt gtcattgctg cctccatgac cattgcctcg 4800
tctgcttcgc tctgatgcaa cttttcttct cgaaggtagt atccattaaa cttgctcacc 4860
tcccggttgt aggtgcccta atgattttta agttgcttgg cggtttgagg atatcaaggg 4920
tcggaggtgg agttatatgt tgccgctatt tgactccaaa aacatgatcc agacttattg 4980
ttgacagggg ttgaattatt agaatgcata ttccaagaat taacctataa tataagtaaa 5040
ctacaaatat aaatattaaa taaatgagaa atgattcact caccaacttt tcctcatagt 5100
cattcatcca ttctagcctc tttggacact tttctttcgg cccaggattt tcctcggctt 5160
ggttttcaaa tccaacatac tagacatgta tgtggaattg gaggaggtgc tcatacagag 5220
gtggagcata tgcaggaggg gcatacagag gtactgagaa agaagtttga cttccatccg 5280
cagcaggtgg aggggcatac agacgtaccg aggaaaaagc ttgaattctg gcttgggaag 5340
ttggaggttg accatatgaa ggcggcaagt atgaatacag atgataggaa aaggttatgg 5400
tggtggtgga cgcgcaactg aaaatagtgc atgggggact gaagctgaaa catcagagcg 5460
acaatgtagt ggagagactc atcaaacgga ggggtttgtg acccatcgga ctacaagaga 5520
tccatgaagg tgttcaaatc tggggaccaa cccgatattg tgtgaacaga ggggagtttg 5580
gaagagagaa acgaaatgaa atggtgtgtg gaatgagctc aacccaagta gaggtactta 5640
caaagggatt ggggatgaaa tttgtgattt tttgcaattt tttatttttt ggattccaaa 5700
cgatcaaaaa caactagttg caatagctag ctgtggggga tagatatccc ccgggtccac 5760
taagggagta aaagacctca cgaaaggccc aagggcccaa taaatcgtaa ggtcattctt 5820
ccgtgggcct ggggagaaac aaccaacaaa acagagaaga cgtaagaccg gattggtgca 5880
aacccggacg gcccacaacg tcgaacgagt aaatcgcaac agagacccga ctttcccgcg 5940
ctggagcccc catgcaacgg agccatgcga ggataagtcg gcgagggtta cgtagggata 6000
aactcaagag gttcactacc ttttagctac ttgttgttat catatccacg tgtactgccc 6060
cacggtcgag tatataaggc ctagggggca ccccttcaga acgatcgacc ctatcttact 6120
tagccaccca cagcaactct ctgtgtcttc aatccagaga gccctcttgt aaccacgctc 6180
acatactcac caggacgtag ggtgttacgc atctctaagc ggcccgaacc tgtaaatctt 6240
gtccactgtc cctcgtgtga tcggcacgaa ctgttttgct acagtcgtcg acaccgtcct 6300
actcctagaa acaccttgag gggcaacccc gggtgtgcgg ttggacccaa aacaccgaca 6360
gctggcgcgc caggtagggg gtgtgtcgac gatccaagct agctcaatgg ccatcacctt 6420
ctacagcaag atcaccatgc gtcctggatc cgtattctgc ttcgggacaa tctcatctgt 6480
agcggatgaa gagggaattc tacaccgtat cgcagatccg ccggaaaaga agactcctcc 6540
aacgaactcc gaaaatgccg gagaggcaca acctccagct cttcggaaaa agatcgtctc 6600
cggaaaggcg ggggccgagg gctcgctgac ccggaagact ccgttgtcta cttcctcgac 6660
gaaagaatgg acacggatca cgaggaagaa ggagaccggg gaaaagcaag tcgttctttc 6720
cgttcctccg gtctcaaagg agaacggaaa gaaagtcgcc gcgacagcag caccattcta 6780
ccccgacgtc ctcttcgtcg ggagagtgga gtcgcccacc gtctctgacg acgaaccgac 6840
cgcgcccgga gaagagccgc ctcaacgaga atcccgccga cggagaaacc ggcgcaggaa 6900
cgttcgacga catcacgcgg ccggagaacg ggatccggag cagcctgtct cgcgagacga 6960
ggtctcggag ataggagaaa ctccggaaga acgcgtcttc agagaacgaa ggaactcccg 7020
acgacgtgat cgccggcggg ctcaggaaca ggccgagcaa gatgcaaggc aacgccggga 7080
gaatccgctc ttcgggcgca acctaaatcc cgacttcgcc cgagctatga acacgccaag 7140
cgaagtcgga ggggtactag cttggatagc tgatggactt cctcgaactc ccgacgccga 7200
gggataccga cgcctgttca cccaggcagc caaccatctt ctacctctcg ctcacccgcc 7260
gaacgatcta cgacacgcca tcaacagtcg ccgagacgcg cgaagctcca tcaatgcttc 7320
gcgcgaacgg cggcatgaga acgagattcg ccgtcgggag gaatacgacc gggatcatgg 7380
catcccgact cagagccagg ccaccaggac tgagtcggca acagcctcaa ctggcggaac 7440
cacccgggga cggccgagga accacaatca caactcccct ccccgggaca gacatcgtcc 7500
ccgacaacag gaggacacgt gcggagtgtc cgctcttact ccacgcctta gggccatcca 7560
atggcctccc aacttcaagg tatccaatgt cgacaaatat gagcctaagc aggatccagg 7620
gggttggcta gccgtctaca ccaccgctgc tcgggctgtc ggagcatctg aggacgttat 7680
gaccgcgtat ctgcccatcg tccttgggca agatgcgcta cagtggctac gacatttacc 7740
ccgacactgc atcgacgact ggggagactt cagtcgacgt ttcaccgcca acttccagtc 7800
cctctccgac aagccagcgc aaccgtggga cctcaaatcc atcaagcgtc ggggggatga 7860
gactctccgg tcgtacctca aaaggttcca gaccatgaga aatcgcatcc ccgaggtcac 7920
ggaggcggcc gtgattgagg acttctacag aggatccaac gactcggctt ttgtccgagc 7980
catactacag aaagcgccga ctacttccga ggagctgttc cgggaagccg acctctacat 8040
caccgccgac gagcgagctc aggacctcat cggaggagcg aagcctgcac cggcagcacc 8100
acgacgcgac gcgaaccaac cacccgacaa acgctgggag aagaggcctc gcgaagaagt 8160
acacgccgcc ggaccacctg cctctcgcgc ccgaggagga cctcgtggag gcgagcgcac 8220
gctggacgac atcctcgacg cccagtgccc ataccacaag gacatgcgcc acactcttcg 8280
caactgccgg gacttcaagc actccgttgg gcatggccga cccttccaac ctctacctcc 8340
tcctccgccg aggggaggac cggatgaacc gcgacaacct catcagccgg aggagggagg 8400
aggaggagct ttcccacgcg tcgacaggga ggtcaacgtc atcttcggcg gacatgggtc 8460
gcaggagaac aaaagacaac aaaagctcaa cgaccgccag atactggtgg cgaccaccgg 8520
tcctcccgcc ccataccggt ggtcagaaca cccgatcacc ttcactcggg aagatcaatg 8580
gctcaacttc gaccatccag gcaaataccc gctcctcgtc gatccggtga tccgagagag 8640
ccgggtgaag aaggtgctag tggacggggg gagcagcatc aacatcacct tcccccggac 8700
gctccaaggc ttgggggctc acctcaaaga gctccacaag tcggacactc ctttctttgg 8760
catcgtgccg acggagggag aatacccgct ggggcacatc tacatgccgg tcaccttcgg 8820
aactccggag aactacagaa tcgagttcct gaggtttgaa gtggcgaact tcgactgcgg 8880
atacaacgcc atcattggaa gaccgggatt ggccaaattc atggccattc cgcactatac 8940
gtacatgata ctgaagatgc caggaccgca agggatcata actgtgcgcg ccgacttcca 9000
aggcgccgca gaatgtttcc gagtggccat ccaggcagcc ctcaccacca agccgccaac 9060
ggtcccctct acactggcga attctaagcc tgaggaggac ctcgccgtac cggcaaacga 9120
agctcaggcc gcgacctcta tgcggccgac tgaagaaacc aagcgaatca acctggggtt 9180
cgctgatgag cgcaagacgg ccatcatcag ctccagcttg aacgacaaat aggaaggcgc 9240
gctcgtccag ttcctgcaag ataaccgaga tgtattcgca tggcaacctg cggatatgcc 9300
gggagtccca agagaactgg ccgagcacaa gttgaaggtt tatccccagg cgaggccgat 9360
ccggcaaaag ctacgtcgtt tcacgcccga caagagagag gccatttgcg ccgagttagc 9420
tcgcttggtt gcggctggat ttattagaga agtattacac cccgagtggt tagctaaccc 9480
tgttcttgta ctcaaaaaga ataaagtgga ttggcgcatg tgcgtcgact atactgatct 9540
caacaaacac tgtcggaagg atcccttcgg gctcccgagg atagatcagg tggtggactc 9600
taccgccgga tgttctgtgc tgtcattctg agattgctat tccggatatc atcagattag 9660
tttggcaaaa gaagacgagg agaaaacggc gttcatcact ccgtttggtg ctttctgtta 9720
cacctccatg tcgttcggcc tcaaaaacgc tggagcgact tatcagagag ccattcaaac 9780
atgcttagcc aatcactggg gcaagcgtgt ggaggcttac gtagatgatg tggtgatcaa 9840
aacagagaat tcggaaaact tcatcgaaga tttacagctg gttttcaaca gcctgagaag 9900
atatagatgg aagctcaatc ctgaaaaatg tgttttcggg gtaccagcag gaaagttgct 9960
cgggtttatc gtcagccact ggggaattga ggctaatcca gataagattg aagctatcat 10020
gaagatggaa gctcctcggt cacaaaagaa ggttcagcga cttactggat gtatggcagc 10080
tctgagcaga tttatatcca ggctgggaga aaaaggttta ccattttaca agctactcaa 10140
gaaggtggat aagtttcaat ggacttcaga agcacaagaa gctctagacg cactgaagaa 10200
attcttgaca acagcaccag tactgaaacc accccggcga gctacgccga ctcaaccggc 10260
tgaagatttg ctgctgtata tctcttgcac gactcatgtg gtaagcaccg cgttggtagt 10320
cgagcgagta gaagaaggac atgcctatcc agtacaacat cctgtttatt tcatcagtga 10380
agttctaggc ccctcaaaga aaaagtatcc tcaggttcag aagctattat atgcagtact 10440
tctaactgcc cgcaagctgc gtcactactt tgacgaccac aaagtcatag tagtcactgg 10500
ttttccaata ggggacattc ttcacaacaa ggaagccatt ggccgaatag ccaagtgggc 10560
ttgcgagctg ggatcccacg acatcgagtt ccgacctcgc actgccatca aaactcaagc 10620
actggttgat ttcgtatcag agtggacaga acagcaagta ccagataatc cagaaactgc 10680
agaagtatgg cgaatgtatt ttgacggctc gctgaagctg cagggagcag gggcagggat 10740
tctcttcact gcacctggag gcgaacacct caagtacgcc ctctagttgc tattcccggc 10800
ctctaacaat gcagccgagt atgaagcttt gatacacgga ttgaacatcg ccatatcact 10860
gggcgtcaag agattgatgg tatacggaga ttctctggta gtcatcagcc agataaacaa 10920
ggaatgagat tgttcaagtg attcaatggg aaaatactgc gctgccgtcc gaaagctgga 10980
agataaattc gagggtctgg aatttcatca tatagaaaga gatcgaaaca cagcagccga 11040
cgtactgtcc aagctcggat ccggtcgaac tcaggtccca accggagtct tcgtgcaaga 11100
aattctgcag ccgagtatct caatggatca aacagaagag tgcaacgtca taaatcaacc 11160
tgagtcagac tctgatgact ggagaaggct gattattaag tacataaaga atgacgaaga 11220
accagacgac aagaactcgg cagagcgcat tgccaggcag tcggctcgct atacactcat 11280
tggggaggag ttgtacagaa ggggcgcatc aggcatcctc atgaagtgcg ttctcccgtc 11340
cactgggaaa caacttctgg aggaggtcca cgcagggcaa tgtgggatac atgcagcatc 11400
cagaacacta gtcgggaagg ttttcaggtc aggattctat tggccgacgg cgaagaacga 11460
tgcagccgag ttagttcaga gatgcgaagc ttgccaatac ttgtcaaagc aacagcacct 11520
gccagcacag caactacata ccataccagt aacctggcct ttcgcatgct ggggactgga 11580
tatgattgga cctttcaaga aagctcaagg gggatatact catgtattgg tggcgattga 11640
caaattcact aaatggatag aattcaagcc cattgcttct ttaacctctg ctaaagccgt 11700
ggaattcata caagacataa tattcagatt cgggataccc aacagtatca tcactgactt 11760
aggatccaac tttaccagtt cagaattctt cgacttctgc gagcaaaaga gcattcagat 11820
caagtatgca tctgtagcac atccaagagc caacgggcag gttgagcgag ccaacggaat 11880
gatattggag gcactcagga aaagggtctt cgacaagaat gaaaaattcg caggaaagtg 11940
gataagagaa ttaccttatg ttgtttggag cctaagaacc caacctagcc gagccctgca 12000
tggaaacact cctttcttca tggtctatgg gtcggaggca gtgctacctg ctgatctcaa 12060
gtttggggcg ccaaggttga tcttcgaaag catagcggaa gctgaggcca ccaggctgga 12120
ggacgttgat gtacttgagg aagaacggct gaacgcggta atccaatcag cacggtacca 12180
gcagactcta aggcgctatc acgacaaggc tatgcggcaa cggttctttt cagtaggaga 12240
cctcgtcctc cgccgaattc taacgggaga gggacggcac aagttatcac ccttatggga 12300
aggacccttc ataatagcag aagtcactcg gcccggatcg tatcgcctca ctcagatgga 12360
tggcacagaa gttgggaact cctggaacat agagcacctc agaaaatttt atccctagct 12420
gtatttcaaa actgctgggg cgacaatgta ttctgtaaag tggaaatatg tcgtcaataa 12480
agagagattt caaagatact cggctcgttt acaattgact tgcattctca cttaactcgg 12540
ggtgaccact atgccctaca aacggagcaa tcggcttaag tcggcaacga cttaaggcga 12600
tgcaacatgc tcacgcttac ttaacccggg atgaccacta tgccctacaa acggagctat 12660
cggcttaagt cggcaacgac ttaaggcggt gcaacatgct cacgcttact taacttaggg 12720
tgaccactat gccctacaaa cggagcaatt ggcttaagtc ggcaacgact taaggcggtg 12780
caacatgctc acgcttactt aacttagggt gaccactatg ccctacaaac agagcaatcg 12840
gcttaagtcg gcaacgactt aaggcggtgc aacatgctca cgcttactta actcggggtg 12900
accactatgc cctacaaacg gagcaatcgg cttaagtcgg caacgactta aggcggtgca 12960
acatgctcac gcttacttaa cccgggatga ccactatgcc ctactaacgg agctatcggc 13020
taaagtcagt ggtggcttaa gccggcgcaa catactcgcg cccatataat tcaggggacg 13080
acttccatat cccgccaaca aatttcatga tcatcatgcg tcattaccac aaatttacga 13140
accaataaat tctgatacga taagagagta attatgtcat tcgaatgata aactgatgta 13200
ttttaacaaa tactcgatca tgctaaccgc gcgctcagag cacgcaaaat gtttctctat 13260
ttcgcaatgt ctttttcagg aacgaccgac gaagtaggac gattcgagga atcgggggca 13320
gcattcacgt cagcctttat gtcttcagga acaaccacgc cgggtctcct cattaagatt 13380
cgtccagcac gaatagcctt gtccatggct ttatcgcgct gggctttgag agtagtcgca 13440
gtttcttcgg caactttagc agccagccga gcagcctcta actcctgggc aatggatttc 13500
ttggaagctc ggagttcttt gatggtggca tccttcgctg atatcacttg cctaaggcgg 13560
gtcacttcgt ccgcagattc ttgcagccta caacgctgat tgtccagttc ctccattgta 13620
aagcggtgac tcctctccaa gatggtcagc gagttgttag aatcacgata caatctgtct 13680
agattgtcac gagaagcagc aaggatacgt ttttcttcct acaaacaaaa atcaactcct 13740
tcagaaatca agcaagtaat aacagcacac ggttttgtaa gttacctttt cagagtcaag 13800
ccgagcatga agagaagaac tcagggcatt ggcatcatcc aaagcagcgg agacctgatt 13860
taattcagtt tgactctgag agtacttctc ctcgaagtca gcgcaccgtt gaaccatttc 13920
agcctgctct cgggagtgtt tttcctcaag aactgcaatc tgctgagtca ttcctatcaa 13980
gaggtaatca aacaaaatga ggtcagaagg taaaacagtc cacgaacaaa ggcgaagaag 14040
aataagaaaa aagggcacta accagcgtta gttgcctcca actcggatac acgacgatga 14100
agcgacactg gattccaaca cgcaagagac gaagccactt ctggggcgga agcaccctgc 14160
gatctcagct ggctggccat cccatctacc aaagcctgat aagaagaaca gatgaacata 14220
atgacaaaag ttcacgcaac ataaagaaca agctaaaata cagcacagta cctggaggtt 14280
ggaaaagaac gaagggatcc ccaaatcagg agaaatcagc tgataaccag gcgcaaggcc 14340
accacccgaa gcagcttgca acgaaccagt aggaatcagt tcagtgcctt caacagagcc 14400
aaacgcccga tcagcgggga cgctgccctc taaaatgcct ctctggtcca aagtttgggc 14460
taccaccatg cagccagagt gtggaggtga acccacgtga acgtccatag aagtgcagga 14520
aggagaccct gctcgggcac cctcgggggc tgggtcatag ttggcactgc ccacttgagc 14580
cggatcatcc ccggcagaac cctcgggggc tgggcagtgg cttacattct tcacccgagc 14640
taagtcatcc ccagcgacac cctcgggggc tgggcatgtg tcagcaccat tcttgagatc 14700
caggctctcc gcagtaacca cctctaaggt tgacgggcct tcagccactt ccatggaacc 14760
aggacaatcc aagtcagcat cccgaccctc gagatcgcgc tctaaggtcg acgaggcacg 14820
ggatgacctc aacccagcat caggcacggc agcgcaagcc tccgttgcat catcatccac 14880
tggctctgat aacaagtcct ctgggaccat atcctcaaga gtttgatcaa agttggccag 14940
ggacagctct tgcagaccaa tgagggcaga caaagcagga gaaggaactc cactacttcc 15000
accgctggcg atgaactgcc gactgttttt ccgagttaaa ggagcttcat tttcttcctc 15060
ctcatcttcc acagtgacaa cacaagcagc acccccattg ggatcagcaa cagatggagc 15120
acccacattg ggatcagcag cagtttgggt acacccattg gggtcagcgt cagtaaggcc 15180
agttgcaggc acttcttcaa cagcaggaac taaggtaccg gcgtcctcat caaaactgga 15240
tactcgccgg aggcgtcttc tcttcttctt ttgctcatca gcagaaggct caggctgact 15300
ggttcggcta gggcgcctcg ggcgagtatt gactggtttc tggacatcca aagttgtatc 15360
aacctctgga aggggcacca ctgccaacgt accagcagga gcagcgtcgg aggaatcctc 15420
agctagcaga tcaagcatgg catttatgtc cgcatcacta gggttcaggg gcacctcaaa 15480
atggacctgc cgttcgtcat caggaatctc cccaagcgaa gcaaccaagg taccgacttc 15540
ttcagcagag gatcgcactc taaggcccaa attgccatca gtcacaggcg gatttgacac 15600
aaaaagggtg aaagctttgg gaggaggcag gttccaggcc gagtatgcca ctggagcacc 15660
aacattcgaa accttacccc tgaggatcat ttcaagtcgg cctaccaagt ccacaggagg 15720
aattctccta ttggtaaccc gagttgagtc ggctaaccct cgatacagat atgctggata 15780
ggccctgtct ttcagtggct gaatgttctt aaaaacaaag tcagtgacca cagcttcagc 15840
agttagaccc ctctctttca gcagtccaac ttcagttagc aacacacctg cctcagccac 15900
ttcctgatct gtgggagact cagtccagct cggagtgcga acgtctggct gtcttcccga 15960
ccgggggggg ggggaatttc cataattatc aactatgaac cactctagac gccatccctt 16020
aatactgtcc ttgaggggaa tctcaagata ctcagttttc cgcccgcggc gcatctccaa 16080
actggcacct ccgaccaact gatgctgtcc cccggccatc ccagggcgac aatgatacaa 16140
atacttccat aagccaaaat gcggcagcac gccaagaaag gcttcgcata agtggacgaa 16200
aatggagatt tgcagaatgg aattaggatt caaatgggtc aagttaatgt ggtagaaatc 16260
aaggaggtcg cggaaaaagg gagagatggg aaggccgagg ccgcggagaa gaaaaggagc 16320
gtaaactaca gactcgtggg tatcctctgt cgggacagta gtcccgtggc aaatccgcca 16380
agaacagagt tctcgcggag gaagaacctc gatggatacg aggtggagaa gttcagcttc 16440
ggaaatgatg gacatatggt tacctgcgaa gggcaactgg ctgttggggt cgattggagg 16500
gatcaccgca gcagacgagc tcgcagtttt cctcttgggc gccatcttga ttttcaccag 16560
cgaacagaat agggggcgaa tggcagagag gattcagaag cgggaatgca agaactaggg 16620
cacggaaagc aaaggcggct aaaagcgcag ctcttatggg atattctcga gccagatacc 16680
gtttcaaaag tgcccagtca tcacccgacg gttatttccg aaaccccagc atgccacgtg 16740
gtcatctggc agttatttcc aaaaagccga cgtgtcactt catcactcgg ttatcatcct 16800
caaaataact catgcggccg gctatcactc ggcgttgact ctaaaacgct gatttcatat 16860
tcagtcgctc ggcattacct ctaaaatgcc gacgtcacca tccagacact cggtgttgac 16920
tctaaaacgc tgatttttta ttcagttgct cggcattacc actaaaaagc cgacgccgac 16980
ctccagtcac tcggcgttgc ctctaaaacg ctgatctcgt attcaatcgc tcggcattac 17040
ttctaaaatg ccgacgttaa ccttcaatca ctcggcgttg actctaaaac gctgatttta 17100
tattcagttg ctcggcatta ccactaaaaa gccgacaccg acctccagtc actcggcgtt 17160
gcctctaaaa cgctgatctc gtattcaatc gctcggcatt acttctaaaa tgccgacgtt 17220
aaccttcaat cactcggcat tgcctctaaa acgctgatct cgcattcgat cgctcggcat 17280
tacttctaaa atgccgacgt cgaccttcaa tcactcggcg ttgcctctaa agcgatgatc 17340
tcgtattcga ttgctcggta ttacttctaa aatgccgacg tcgaccttca atcgctcggc 17400
gttgcttcta aaacgccgat accgactaca agattactcg gcagctactt ctggaagcgt 17460
cagcgtgata cccaagttat tcatctactg tctcaaaaga atcagtttta taatcaagca 17520
aagcgagaca tcaagaagga gccaacgtca ttctttcatt aagggaagac aataagttta 17580
caaatcaact ctttgcgagt tgatgcttcc ctactattac tacattacat tactactact 17640
actatactat actatactac tctacattac tactacatta ttctaactac actatactaa 17700
tatctaaaga ccagcgacgc ttagccactg gccttgctgc tgctgccacc gccgccgccc 17760
ctggtgctgc ccttgctgct gccgcctctg gtgctgcccg tgctgctgcc gcctctggtg 17820
ctgcccttgc tcccgtcacc gctgccgctg cccccgccgc tgccgctgcc gtgaccatcg 17880
ccgtcgccac cgtcgtcgtc gtcgtcttcg tcgtcgtcgt catcctcgcc ctcgccgtcg 17940
tccgagtcct cctcctccga ggagaactcc gactcatccg agccctcgag cccggagcgc 18000
tcgacggccc ggatgtacgt ccagacttcc gcggcaatcc cctgggagtc gtctgaatca 18060
tcagacgacg ccgggggaga gacgggagcc agagacccct cggactcgga ggagaactcc 18120
tcctctgagt attccgagtc gccgaagtcc tccgacggag gagtcggctc gcgcttgcgt 18180
ttgttactct tgcccatggc ggaagcagac aggagagaag agaaggatgc agtaaagaac 18240
agcgaagaga tgtgaaaaaa ccagaggagc aacggcgtta tttatagaag ggaaaggcaa 18300
ccgctcacct ccaaccgtgg tcactaaaca gtcgcaaagc attcaataag cacttccacc 18360
cgtctgaaga cgcgtcagac ggctgacgcc gtttcatgca acactacacc cattgggact 18420
ccagtcaaca gcgcaaagga tatgattaca ctcgccgtcc catcacatta ctactcagaa 18480
gcagccggct aaaacactca gcgtaccaag ccgtcccttg cccacaccca ttggggggac 18540
gcccaggaat tatcagtata tttttcaaaa cggtcacatc cgtgcagggc acgcagtgaa 18600
tacctcaaga caaaaatgag atatcagtaa ggatcagagg aaagccaaat atagccagca 18660
atgtacaaga tatggccgac agaagcgacg tgaagactag acagagaacg tccgtcaaac 18720
gtccaatcag tcgcagaagc aaataaattg cactacctag caagatatgg atggattgca 18780
aactcggctg ctaaagacaa aatatacgct gacctctgca gcaaaatatt gatgacataa 18840
tgctgacctc caaagcataa tgcaaatagc ttcatgccaa tttttacaaa cgaaagaaag 18900
accttcgaat ggattatcct caaaaatcca tttgaaggtc gggggctaca cccattgggt 18960
gcacctccgg tgcaccccct ggattatcat tccaaaccga gatagtgccg acttctaagg 19020
cacgggacaa gattaaaata ccaatcctcg accaagatgc aggagcacaa atggagataa 19080
tttctgggga agaccttcga gtagattatt ttctaaaaat ctactcaaag gtcgggggct 19140
acacccattg ggtgcacctc cggtgcaccc aatgaagttc agaatcctgc aaatcgaaat 19200
gtcgacctct aaggcacaag cacgaaacta agcttcggtc aaatgagcga tcggagcaag 19260
agaagacagc aggaagtcat tttttggacc tgggatcttt gggttgatta cctctaaatt 19320
aacccaaaga tcgggggctt gtggtggata gatatccccc gggtccacta agggagtaaa 19380
agacctcacg aaaggcccaa gggcccaata aatggtaagg tcattcttcc gtgggcctgg 19440
ggagaaacaa ccaacaaaac agagaagacg taagaccgga ttggtgcaaa cccggacgac 19500
ccacaacgtc gaacgagtaa atcgcaacag agacccgact ttcccgcgct ggagccccca 19560
tgcaacggag ccatgcaagg ataagtcggc gagggttacg tagggataaa ctcaagaggt 19620
tcactacctt ttagctactt gttgttatca tatccacgtg tactgcccca cagtcgagta 19680
tataaggcct agggggcacc ccttcagaac gatcgaccct atcttactta gccccccaca 19740
gcaactctct gtgtcttcaa tccagagagc cctcttgtaa ccacgctcac atactcaccg 19800
ggacgtaggg tgttacgcat ctctaagcgg cccgaacctg taaatcttgt ccactgtccc 19860
tcgtgtgatc ggcacgaacc gttttgctac agtcgtcgac actgtcctac tcctagaaac 19920
accttgaggg gcaaccccgg gtgtgcggtc ggacccaaaa caccgacact agcacacgtg 19980
gaccaattga aagcccccac cttgctctcg ttcgtcgctc gttcacgcca gcgcgtcacc 20040
cacccactgc gccctctcat cctccttgcc cgagaacgtg cttcagagca ggcgagagtg 20100
gggcgatatc gcccgaggga tgcatctctc cctcctctca ccccgggcca ggctacaaca 20160
gccccctact gcccaaccac tcgccctcgt tggcaccaac catactacca caacactcca 20220
atgcacaatt tttaatgtta gcctatattc accttagcat cacatcatat ttcttctaca 20280
aaattatatt tagaacgaaa cacgacgttt tgcttggaat tttttcgatg gagtagaaaa 20340
aatataatcc aaacaaatta cgtaaaatac gtaaaataaa aaatatagct cctaaaagtt 20400
aaaattactc atcattatca ccctcctcgt tttcttcctc gtctagtttt aattgcgtga 20460
tcaatttttt tagaaccaac ctagaccctc ctcataccag tggtggattg tttcagtaac 20520
ttggtgaact ggtcgtacaa ttttttgatt ggtttctcgt gtcactaacc ttgaataatt 20580
gcttcgttat ggttttcttc tggacaaggg actcattggt actcattcct ggtgcctaac 20640
ccttgttttg tgctcttgcc caatcacgac caatagggta tggtggtttg gcactatcgg 20700
acgatgtaga gttataatca ccctccacgt tgaggcaaga tcattttctc tcattgctag 20760
agtttgaatc accatgtcac gtgcaccact tgaattgatg atgaagagca cgccattagt 20820
ttcatcgagc ctgttgtgga agagtagcat aacattattt gatctgctcg gtaggttata 20880
cgtggccgat atttggcacc aaaaggtcaa acatttttgt tgtttccctc aaatcttttt 20940
tggtctcaaa aaggtcaaac ctttttttgg ctttccatcc ctgtccccac gaacagtcac 21000
gagtaacttt ttctcccatc cccgttcgtg tgggggaatt tatccccatg ggaaatctat 21060
ccctgttaga gaatgtaata tttttggggc aaggtcaaat tgataaacca atataaattg 21120
aacaaataag atttaaaatt acaagagaaa tctactttag agttgagctt gctattttat 21180
aaaaggctat gtgttgaatt tttattataa ctttaacata tcaatggatt gattttagat 21240
taagagaagt tcgtgggggc ggatatgcga ggaacaggga tggggaatgg ttcaccattc 21300
tcgtcccacg aacacgacaa ggactaaatt tttctcgttt caatctccgt ggggactaaa 21360
ttacacctat ccccgtccac taataaaggg ataccccgcg gggaattagg gatcacgtcc 21420
ccatttcaca tttttagact tctcacattg agcaacaaca aaacatttta tgaattagta 21480
gccattttac ttatctaaaa caattactat tgaatcttaa tcattttgtg caaaataaag 21540
aatgaactaa attttgggtc gggtgtgggt cacccgtagg ttgaaataaa aactcgcacc 21600
cacactcgtg aaactttggg tcagatgagg gttacacccg cggattaaaa tctctaccca 21660
tacccacacc cgtcagatcg agtacccaaa gattttgggt ttgcgggtta aattgtcatc 21720
cctagacacg agtgtgctgg aggatttgga agtttcgcaa tgcgtactta ccaagtgttt 21780
ggttctatgg attaaagttt agcatgtgtc gcattagatg attgaatgcc tattatgagt 21840
attaaatatt gtctgattat taatcaaatt acacaagtga aggctaaaca actagacaaa 21900
tttattaagc ctaattaatc tatgattagc aaatgtttat agtagcagca tcttagtgaa 21960
tcatgaacta attaggttta ataggttcgt cttaacgttt agttcttatc tatgtaatta 22020
attttataag taaactatat ttaatattcc taattagtct ccggatataa catagactaa 22080
aatttagtca gtggtgctgc tgctggctcc ttttcatttc atccgacata atgttttcct 22140
cccaatttat tgtgttgttt tgtttgtgct ttaaaaatga cttgtcctct gcttgctgta 22200
tcaaggtcgt gatgtgtgct taacttattc ccttccttcc tagctgccct tagcatttat 22260
ataggggtat ttggttacat ggactaaagt ttagtttagt ccatgtccaa ttataaaact 22320
aattacataa ctgaatacta aaataccaaa atacgagaaa aattattaaa cctaattaat 22380
ttattattag caatgtttat tgtaacatca cataagcaaa gcatagactg atttagttta 22440
ataggttcgt cttatcattt agtcttgatc tgtataatta gggtatgttt ggttcactgc 22500
ctaacttacc acactttgcc taacttttct gcctaaggtt agttcttcaa tttgaacgac 22560
taaccttagg caaagtatgg cgtagttagc cacgaaccaa acagtccctt agttttgtaa 22620
ttaaactata tttactattt ttaactagta tccaaacatt aaatgtgaca tggattaaaa 22680
tttagttagt gactttaggc ttttagagtt gagttagttg tagcttggtt tagttatttg 22740
tttgttctct tgcgtttatt taggacctct ctataatgtt ttatcacctt aatacaaatt 22800
aaaatacgca gctcttgtgt attgcaggcg tgtgtgttcc tatattttta ggctcaatta 22860
tgaaggaaat tattctcagc gagcatataa ccgttttgga ggtaaaatga actaaaagca 22920
tataggcctg cctgtttgca taagtacacc ctccgtctaa aaaagaataa aaatctcatt 22980
tcttgatgag tcaaaaaagt tcaaatttaa gaaaatatat gttacgacac gaatatttat 23040
aatgtgtaat aagtaccgct agattaattt taaaataaaa ttttcataat aaacctattt 23100
gaagatacaa gtattggtac tatttctaat aaatctaatc aaactggtgt tatatctttt 23160
ggaacaaatt tgtgctttat gtttctggtt gacgtgaatc agcttaatct tgacgaaatc 23220
taacattgtc ttttgttcgt tggcatacag gatcaacaaa aaggagagaa gcagcatcta 23280
ttgttggtaa gagcctatag tcaataccca tgttcatttc gtctaaaaga gcagaagaaa 23340
agcatatgat gaattattgc catgtcatgt ttaaaataca gaattctcaa aaacaaaaac 23400
aaaaaaaaaa acttggaatc cactaaccac tgatagcatt gtagaaaatt tcatcctccc 23460
tttgggcaat acactgatga gtttacatgc tgactagtgg tgcatttgtt ctttgccaat 23520
tgagttttta gaatgctttg cagctgaatt cacttgtgat gttttttttt gtgtgtgatg 23580
caggtgctgt tgccgttgca ttcctgtgtc tagtcattct cacatgcttc ttggcttgta 23640
gacattgttc gctgcccttc aaatcgaaga acaaaccagg gacaaggatt gagtccttcc 23700
tacagaagaa cgagagtagt atacatccga aaagatacac ctacgcggac gtgaaaagaa 23760
tgacaaaatc cttcgctgtg aagctaggcc aaggtgggtt tggtgctgta tacaaaggca 23820
gcctccacga tggccgacag gtagcagtca agatgctgaa ggacacccaa ggtgacggcg 23880
aggaattcat gaacgaggtg gctagcatca gcaggacttc tcatgtcaac gtcgtgacac 23940
ttctagggtt ttgcttgcaa gggtcgaaaa gagcactgat ctacgagtac atgcccaatg 24000
gttcgctcga aaggtatgcc ttcaccggtg acatgaacag tgagaatttg ctaacctggg 24060
aaagactatt tgacatagcg attggcacgg ccagagggct cgaataccta caccggggat 24120
gcaacactcg gatcgtgcat tttgacatca agccacacaa catcctgtta gaccaggatt 24180
tctgccctaa gatctctgac tttggactgg ccaagctatg tctgaacaaa gagagcgcta 24240
tctccattgc tggcgcaaga gggacgatag ggtatatcgc cccggaggtc tactcaaagc 24300
aatttggaac gatcagcagc aagtctgatg tctatagcta tgggatgatg gtccttgaga 24360
tggttggagc aagggacagg aatacaagcg cagatagtga ccatagcagc caatatttcc 24420
ctcagtggct ttatgaacat ttggacgact attgtgttgg tgcttccgag attaatggtg 24480
agaccacaga gctcgtgagg aagatgatag ttgtaggtct gtggtgcata caagtgattc 24540
cgactgatcg accaacaatg acgagagtcg tcgagatgtt ggaaggaagc acaagtaatc 24600
tagagttgcc acccagagtt ctcttgagct ga 24632
<210> 2
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA derived from Ht2 gene (SEQ ID NO: 1)
<400> 2
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 3
<211> 667
<212> PRT
<213> Zea mays
<400> 3
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 4
<211> 1487
<212> DNA
<213> Zea mays
<400> 4
aagtgaacct caccatcgac atcgtctggc tacgactcgc accctccggc tccaacatca 60
cattcctcta caattgcaag aagaacatta gagcatctcc agcaggtcgt gtaaatagtc 120
gtgcaaaata caatttgtac tatagattac actatttgca gtgtgaagtt taagatagag 180
agtaggataa agagtctgct ggacatatta ccctgtcctc tgtcgtggaa ctgagtgggt 240
gcccacagca acaagaagat agaagtaggt cgtacgtgtt gtcgggtggc gggatcatgt 300
gtgctgagac gtacgtatac atgtccaaat aggcaggtcg ggccgactcg gcccgagccc 360
gactaagctc ggcacggatt atgatcgtgc tggcctgacc cagattagca agcaggtcgt 420
gtcgtgcctg cccacgggta tcgagcgagg cccagacacg acacgctaag gtattaaccg 480
tgccgaaccg acccacggcc cgacgggcca aacaggtcta taatagtata tgacgtttaa 540
atgtaaaaaa tatattaaaa tatacataac gaaggtttaa accatattta ttagctctaa 600
acacctattt acacccacat caccaacaaa acaaatatgt ttactgtatt ttatactata 660
tattaagtat aatgtatgta tttgtattaa aaaaatagga acaaaattaa aaatgggtcg 720
tggcgtgttt agcctctcgt ggcgcgcgta gacccagaca caacctagtc accagaccgg 780
gccaaccagt acctgagttt cggaccgccc gaccggccgg tacaagcacg ggtgcgaggg 840
cgtggtggtg gcgccgccgg tgctggatgt acacaagaag gggggaagag aagcccgggc 900
accaccggcg gtccgcctcc ggaacggatc gctccgtcgg ttgctgcagg gcgggttcga 960
gctgaactac gacactcact ccgagcagtg cgtccgatgc tagggctccg gcggatggtg 1020
tggctaccag cgcgaggaga cgcccgccgg cgggatgaca ttcgcctgtt tctgcgacgg 1080
cggccagacc acgggccgat gcggtgccgg tatgtctttt ttttttcttc gaacaaggtg 1140
tggcatgtgt tctaccgttt caactagtaa atgattacat tgagctaggc agctagccac 1200
acattttctt gaatgatttt ctttgatgaa cctgctgttt gcttttatga cgtgaacaac 1260
ggggcctgca agctgccaca tacctaggga gactagttcg tgaccttctt tacacgtctt 1320
ctctactcgc cactgggagt tgacgccgct cggtcgtccc actttgtgac gttcaaccag 1380
agtctagaga tgtaattctc tgcgaataca ggactagttg gagctaacaa cgcagcttga 1440
cgagggtgaa cccagctcca cctcgtctac cacgtcttct cctcgcc 1487
<210> 5
<211> 1979
<212> DNA
<213> Zea mays
<400> 5
caaagcgtag atatttttcc tatcaaatgt tgcttccagg tcacataaat gcaaatattt 60
gtggagacgt acgagtgccc attaacctca tacactgtat ctgtatgaca aaagtcccac 120
gactcactgg acgcggaaat gtcgcttgac tacgccaatt ttctaaaaag attggcagca 180
attaattggg cttatagcgg taactttggt tcgcattagt tgtaggacta gagttgaata 240
tcgatccaac tcgccgtggc acggtcgagc tcaagctagc tccgctcagc tcattaaaga 300
attcagccag agaatcagct catgtcgttt acgagtttga gctggctcgt ttagctcgtg 360
aatcataaca aaaacaacat gcacatatat acaataatat aatcaatact agttaattct 420
agactagttt aacactagaa aagagtaata atactcataa tttcacatac aatatcaatc 480
taacaccaaa ttaacatatt tcgtcacttg ttagttcatc caatcaagtg taggctttgc 540
tttactgaca aatggttgct cgttcgagct agcgatcgag cttgcttgtt aataaaccga 600
gttgagatgc tagctcaatt tgtgacaaaa ttaaaataag ccgagtcgaa acaagttaag 660
cttatgacga ttcgagcaag ctcacgagcc acaagtatta ttttttttcc agtactacct 720
aagagcatga cgtcggtatg ttttctttac cgacgatggt ggtgattttt atttcgcaat 780
gcattggaaa actggcgaca tgagttcaaa cgcaatgcaa cacactacct cccacgagct 840
ggtttttgtg cgagacagta aagaagcaaa caaatctaac cagccaaatc cttggccggg 900
caccacagac cacggcgaac aactccccct ctctcttccg tccatcttat ttcttcgccg 960
tgcgtggctc tgcttgcgcc gacggccgac ggatgagcta ctaggattac ggctagcaac 1020
tcgggacggg caccttgcac gcggtgaaca ccctgcgctt gtgcctggcg tcgacgaggc 1080
gcttcaggct ggcgtcgtcc ttgtaccggc acaggcagcc gggcccgtgg gacatgagct 1140
tggcgcagca ggcggccgtg ggcgacgcct tccccgcgaa cgcgctcgcg caggggctca 1200
gctgcgtcac gtcgcacggc gccagggccg agaagtcgcc cgcggcgcgg ccggcgagga 1260
ggaggaggac gctggccagc accgcggcga ggaagagcgc ggccggcctc atcgtcccga 1320
ccgacgatag atggtgtcac tggatatata ggtcggaccg gactagctgc gagtggacta 1380
gctgggtggg aagccacgta cgagcgtcgt cgggagcttt tttgtaggcg ccgattagtt 1440
gtgtgctatg gcggattatt agcccggcgg aaggtgaggt gagtcacggc gtaagcatgc 1500
ggcacagtcg agcgagccca gcagtgtccg ttaggttagg tgaagcacgc tgcacgcccg 1560
gtggaagggc tcaccatttg atgctttctc atcgctcatc agtcatcact atgattctag 1620
agaatatatc tagtacatat ggtgtacata ttaaatgatc atcacttatt ttagatctaa 1680
tgtctctagt tgtttgatat attttgctaa tgacaccctc caacgttggt gtgtagtggt 1740
ggaaggtgtt atttgtaaat taaatgatca actagagacg ttagatctaa aataagtggt 1800
gatgatttaa tatatgcacc atgtacacca atcttctatg tgcaccagat atgtcctcat 1860
gattctaaca gagaggtacg tgcgcatcct gcgaacgtat tgttgagttt tttttaagtt 1920
caacacatgg ttacgtcatg atcctatact attctcgaat atagatgaac aaacgggcc 1979
<210> 6
<211> 920
<212> DNA
<213> Zea mays
<400> 6
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag 920
<210> 7
<211> 37
<212> DNA
<213> Zea mays
<400> 7
atcaacaaaa aggagagaag cagcatctat tgttggt 37
<210> 8
<211> 1047
<212> DNA
<213> Zea mays
<400> 8
gctgttgccg ttgcattcct gtgtctagtc attctcacat gcttcttggc ttgtagacat 60
tgttcgctgc ccttcaaatc gaagaacaaa ccagggacaa ggattgagtc cttcctacag 120
aagaacgaga gtagtataca tccgaaaaga tacacctacg cggacgtgaa aagaatgaca 180
aaatccttcg ctgtgaagct aggccaaggt gggtttggtg ctgtatacaa aggcagcctc 240
cacgatggcc gacaggtagc agtcaagatg ctgaaggaca cccaaggtga cggcgaggaa 300
ttcatgaacg aggtggctag catcagcagg acttctcatg tcaacgtcgt gacacttcta 360
gggttttgct tgcaagggtc gaaaagagca ctgatctacg agtacatgcc caatggttcg 420
ctcgaaaggt atgccttcac cggtgacatg aacagtgaga atttgctaac ctgggaaaga 480
ctatttgaca tagcgattgg cacggccaga gggctcgaat acctacaccg gggatgcaac 540
actcggatcg tgcattttga catcaagcca cacaacatcc tgttagacca ggatttctgc 600
cctaagatct ctgactttgg actggccaag ctatgtctga acaaagagag cgctatctcc 660
attgctggcg caagagggac gatagggtat atcgccccgg aggtctactc aaagcaattt 720
ggaacgatca gcagcaagtc tgatgtctat agctatggga tgatggtcct tgagatggtt 780
ggagcaaggg acaggaatac aagcgcagat agtgaccata gcagccaata tttccctcag 840
tggctttatg aacatttgga cgactattgt gttggtgctt ccgagattaa tggtgagacc 900
acagagctcg tgaggaagat gatagttgta ggtctgtggt gcatacaagt gattccgact 960
gatcgaccaa caatgacgag agtcgtcgag atgttggaag gaagcacaag taatctagag 1020
ttgccaccca gagttctctt gagctga 1047
<210> 9
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of HtN1
<400> 9
atggctgctc accagcctca cctctccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgg cgagcctcct cttccgagcc cttacaacac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gcctccatgt gctcgtcgtt ctggtgtggc 180
ggcgtcgaga tccgctaccc gttctatctt gccaacgcaa tcgccgacta cagcgggagc 240
tactactcct gcggctacac cgacttgagc gtttcctgcg aactcgaggt cgaggggtcg 300
ccgacgacct ggacccctac catccgtctc ggcggcggcg actacaccgt caagaacatc 360
tcctacctct acgaccagca gaccatctca ctggcggaca gagatgtgct cggaggcggc 420
ggctgccccg tcgtccgcca caacgtcagc ttcgacgaga cgtggctgca cctgcacaac 480
gccagcgcct tcgacaacct caccttcttc ttcggatgcc actgggggcc acggaataca 540
ccgcctgaat ttgccgacta caacatcagc tgcgccgggt tcaatactcc aactatcagc 600
ggtggaaggt ccttcgtgtt caagactgga gatcttgacg aacaagagga gcaggagttg 660
gctttacact gcgacgaggt tttctccgtg ccagtgagaa gagatgctct gcaggcgatc 720
gtcagcaact tcagcctcac acgggacggg tacggcgagg tgcttaggca ggggttcgag 780
ttggaatgga atcggacatc ggaggatcag tgtggccggt gcgagggatc gggctccggc 840
ggatggtgcg cctacagcca gaagagagaa ttcctgggct gcttgtgcag cggagggaag 900
gtgggcagcc cgttctgcaa accatcgaga tcaaaaagga aagaaggacc tattgttggt 960
gctgttgccg ttgcattcct gtgtctagtc attctcacat gcttcttggc ttgtagacat 1020
ggttcgctgc ccttcaaatc ggagaacaaa ccagggacaa ggattgagtc cttcctacag 1080
aagaacgaga gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaaggcta 1440
tttgacatag caattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgtcct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
ataataagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggga gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 10
<211> 667
<212> PRT
<213> Zea mays
<400> 10
Met Ala Ala His Gln Pro His Leu Ser Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Asn Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Ala Ser Met Cys Ser Ser Phe Trp Cys Gly Gly Val Glu Ile
50 55 60
Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Ile Ala Asp Tyr Ser Gly Ser
65 70 75 80
Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Glu Leu Glu
85 90 95
Val Glu Gly Ser Pro Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly Gly
100 105 110
Gly Asp Tyr Thr Val Lys Asn Ile Ser Tyr Leu Tyr Asp Gln Gln Thr
115 120 125
Ile Ser Leu Ala Asp Arg Asp Val Leu Gly Gly Gly Gly Cys Pro Val
130 135 140
Val Arg His Asn Val Ser Phe Asp Glu Thr Trp Leu His Leu His Asn
145 150 155 160
Ala Ser Ala Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly
165 170 175
Pro Arg Asn Thr Pro Pro Glu Phe Ala Asp Tyr Asn Ile Ser Cys Ala
180 185 190
Gly Phe Asn Thr Pro Thr Ile Ser Gly Gly Arg Ser Phe Val Phe Lys
195 200 205
Thr Gly Asp Leu Asp Glu Gln Glu Glu Gln Glu Leu Ala Leu His Cys
210 215 220
Asp Glu Val Phe Ser Val Pro Val Arg Arg Asp Ala Leu Gln Ala Ile
225 230 235 240
Val Ser Asn Phe Ser Leu Thr Arg Asp Gly Tyr Gly Glu Val Leu Arg
245 250 255
Gln Gly Phe Glu Leu Glu Trp Asn Arg Thr Ser Glu Asp Gln Cys Gly
260 265 270
Arg Cys Glu Gly Ser Gly Ser Gly Gly Trp Cys Ala Tyr Ser Gln Lys
275 280 285
Arg Glu Phe Leu Gly Cys Leu Cys Ser Gly Gly Lys Val Gly Ser Pro
290 295 300
Phe Cys Lys Pro Ser Arg Ser Lys Arg Lys Glu Gly Pro Ile Val Gly
305 310 315 320
Ala Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu
325 330 335
Ala Cys Arg His Gly Ser Leu Pro Phe Lys Ser Glu Asn Lys Pro Gly
340 345 350
Thr Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Ile Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 11
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of RLK1 allele from PH99N
<400> 11
atggctgctc accagcctca cctctccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgg cgagcctcct cttccgagcc cttacaacac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gcctccatgt gctcgtcgtt ctggtgtggc 180
ggcgtcgaga tccgctaccc gttctatctt gccaacgcaa tcgccgacta cagcgggagc 240
tactactcct gcggctacac cgacttgagc gtttcctgcg aactcgaggt cgaggggtcg 300
ccgacgacct ggacccctac catccgtctc ggcggcggcg actacaccgt caagaacatc 360
tcctacctct acgaccagca gaccatctca ctggcggaca gagatgtgct cggaggcggc 420
ggctgccccg tcgtccgcca caacgtcagc ttcgacgaga cgtggctgca cctgcacaac 480
gccagcgcct tcgacaacct caccttcttc ttcggatgcc actgggggcc acggaataca 540
ccgcctgaat ttgccgacta caacatcagc tgcgccgggt tcaatactcc aactatcagc 600
ggtggaaggt ccttcgtgtt caagactgga gatcttgacg aacaagagga gcaggagttg 660
gctttacact gcgacgaggt tttctccgtg ccagtgagaa gagatgctct gcaggcgatc 720
gtcagcaact tcagcctcac acgggacggg tacggcgagg tgcttaggca ggggttcgag 780
ttggaatgga atcggacatc ggaggatcag tgtggccggt gcgagggatc gggctccggc 840
ggatggtgcg cctacagcca gaagagagaa ttcctgggct gcttgtgcag cggagggaag 900
gtgggcagcc cgttctgcaa accatcgaga tcaaaaagga aagaaggacc tattgttggt 960
gctgttgccg ttgcattcct gtgtctagtc attctcacat gcttcttggc ttgtagacat 1020
ggttcgctgc ccttcaaatc ggagaacaaa ccagggacaa ggattgagtc cttcctacag 1080
aagaacgaga gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaaggcta 1440
tttgacatag caattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgtcct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
ataataagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggga gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 12
<211> 667
<212> PRT
<213> Zea mays
<400> 12
Met Ala Ala His Gln Pro His Leu Ser Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Asn Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Ala Ser Met Cys Ser Ser Phe Trp Cys Gly Gly Val Glu Ile
50 55 60
Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Ile Ala Asp Tyr Ser Gly Ser
65 70 75 80
Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Glu Leu Glu
85 90 95
Val Glu Gly Ser Pro Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly Gly
100 105 110
Gly Asp Tyr Thr Val Lys Asn Ile Ser Tyr Leu Tyr Asp Gln Gln Thr
115 120 125
Ile Ser Leu Ala Asp Arg Asp Val Leu Gly Gly Gly Gly Cys Pro Val
130 135 140
Val Arg His Asn Val Ser Phe Asp Glu Thr Trp Leu His Leu His Asn
145 150 155 160
Ala Ser Ala Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly
165 170 175
Pro Arg Asn Thr Pro Pro Glu Phe Ala Asp Tyr Asn Ile Ser Cys Ala
180 185 190
Gly Phe Asn Thr Pro Thr Ile Ser Gly Gly Arg Ser Phe Val Phe Lys
195 200 205
Thr Gly Asp Leu Asp Glu Gln Glu Glu Gln Glu Leu Ala Leu His Cys
210 215 220
Asp Glu Val Phe Ser Val Pro Val Arg Arg Asp Ala Leu Gln Ala Ile
225 230 235 240
Val Ser Asn Phe Ser Leu Thr Arg Asp Gly Tyr Gly Glu Val Leu Arg
245 250 255
Gln Gly Phe Glu Leu Glu Trp Asn Arg Thr Ser Glu Asp Gln Cys Gly
260 265 270
Arg Cys Glu Gly Ser Gly Ser Gly Gly Trp Cys Ala Tyr Ser Gln Lys
275 280 285
Arg Glu Phe Leu Gly Cys Leu Cys Ser Gly Gly Lys Val Gly Ser Pro
290 295 300
Phe Cys Lys Pro Ser Arg Ser Lys Arg Lys Glu Gly Pro Ile Val Gly
305 310 315 320
Ala Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu
325 330 335
Ala Cys Arg His Gly Ser Leu Pro Phe Lys Ser Glu Asn Lys Pro Gly
340 345 350
Thr Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Ile Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 13
<211> 2001
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of RLK1 allele from PH26N
<400> 13
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgctcatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttgtgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaaaaagg aaagaagcat ctattgttgg tgctgttgcc 960
gttgcattcc tgtgtctagt cattctcaca tgcttcttgg cttgtagaca tggttcgctg 1020
cccttcaaat cggagaacaa accagggaca aggattgagt ccttcctaca gaagaacgag 1080
agtatacatc cgaaaagata cacctacacg gacgtgaaaa gaatgacaaa atccttcgct 1140
gtgaagctag gccaaggtgg gtttggtgct gtatacaaag gcagcctcca cgatggccga 1200
caggtagcag tcaagatgct caaggacacc caaggtgacg gcgaggaatt catgaacgag 1260
gtggctagca tcagcaggac ttctcatgtc aacgtcgtga cacttctagg gttttgcttg 1320
caagggtcga aaagagcact gatctacgag tacatgccca atggttcgct cgaaaggtat 1380
gccttcaccg gtgacatgaa cagtgagaat ttgctaacct gggaaaggct atttgacata 1440
gcaattggca cggccagagg gctcgaatac ctacaccggg gatgcaacac tcggatcgtg 1500
cattttgaca tcaagccaca caacatcctg ttagaccagg atttctgtcc taagatctct 1560
gactttggac tggccaagct atgtctgaac aaagagagcg ctatctccat tgttggcgca 1620
agagggacga tagggtatat cgccccggag gtctactcaa agcaatttgg aacaatcagc 1680
agcaagtctg atgtctatag ctatgggatg atggtccttg agatggttgg agcaagggaa 1740
aggaatacaa gcgcaagcgc agatagtgac catagcagcc aatatttccc tcagtggatt 1800
tatgaacatt tggacgacta ttgtgttggt gcttccgaga ttaatggtga gaccacagag 1860
ctcgtgagga agatgatagt tgtaggtctg tggtgcatac aagtgattcc gactgatcga 1920
ccaacaatga cgagagtcgt cgagatgttg gaagggagca cgagtaatct agagttgcca 1980
cccagagttc tcttgagctg a 2001
<210> 14
<211> 666
<212> PRT
<213> Zea mays
<400> 14
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Leu Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Lys Arg Lys Glu Ala Ser Ile Val Gly Ala Val Ala
305 310 315 320
Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala Cys Arg
325 330 335
His Gly Ser Leu Pro Phe Lys Ser Glu Asn Lys Pro Gly Thr Arg Ile
340 345 350
Glu Ser Phe Leu Gln Lys Asn Glu Ser Ile His Pro Lys Arg Tyr Thr
355 360 365
Tyr Thr Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val Lys Leu Gly
370 375 380
Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His Asp Gly Arg
385 390 395 400
Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp Gly Glu Glu
405 410 415
Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His Val Asn Val
420 425 430
Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg Ala Leu Ile
435 440 445
Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala Phe Thr Gly
450 455 460
Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu Phe Asp Ile
465 470 475 480
Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg Gly Cys Asn
485 490 495
Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile Leu Leu Asp
500 505 510
Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala Lys Leu Cys
515 520 525
Leu Asn Lys Glu Ser Ala Ile Ser Ile Val Gly Ala Arg Gly Thr Ile
530 535 540
Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly Thr Ile Ser
545 550 555 560
Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu Glu Met Val
565 570 575
Gly Ala Arg Glu Arg Asn Thr Ser Ala Ser Ala Asp Ser Asp His Ser
580 585 590
Ser Gln Tyr Phe Pro Gln Trp Ile Tyr Glu His Leu Asp Asp Tyr Cys
595 600 605
Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg Lys
610 615 620
Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp Arg
625 630 635 640
Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser Asn
645 650 655
Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 15
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 1625: G->A)
<400> 15
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctgacgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 16
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 542: G->D)
<400> 16
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Asp Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 17
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 95: C->T)
<400> 17
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttctgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 18
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 32: P->L)
<400> 18
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Leu
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 19
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 115: G->A)
<400> 19
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccacccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 20
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 39: A->T)
<400> 20
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Thr His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 21
<211> 2003
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of RLK1 allele from A188
<220>
<221> misc_feature
<222> (190)..(190)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (262)..(262)
<223> n is a, c, g, or t
<400> 21
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcn aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta cnccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttgtgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacatggt 1020
tcgctgccct tcaaatcgga gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta tacatccgaa aagatacacc tacgcggacg tgaaaagaat gacaaaatcc 1140
ttcgctgtga agctaggcca aggtgggttt ggtgctgtat acaaaggcag cctccacgat 1200
ggccgacagg tagcagtcaa gatgctcaag gacacccaag gtgacggcga ggaattcatg 1260
aacgaggtgg ctagcatcag caggacttct catgtcaacg tcgtgacact tctagggttt 1320
tgcttgcaag ggtcgaaaag agcactgatc tacgagtaca tgcccaatgg ttcgctcgaa 1380
aggtatgcct tcaccggtga catgaacagt gagaatttgc taacctggga aagactattt 1440
gacatagcaa ttggcacacg gccagagggc tcgaatacct acaccgggga tgcaacactc 1500
ggatcgtgca ttttgacatc aagccacaca acatcctgtt agaccaggat ttctgcccta 1560
agatctctga ctttggactg gccaagctat gtctgaacaa agagagcgct atctccattg 1620
ctggcgcaag agggacgata gggtatatcg ccccggaggt ctactcaaag caatttggaa 1680
caataagcag caagtctgat gtctatagct atgggatgat ggtccttgag atggttggag 1740
caagggacag gaatacaagc gcagatagtg accatagcag ccaatatttc cctcagtggc 1800
tttatgagca tttggacgac tattgtgttg gtgcttccga gattaatggt gagaccacag 1860
agctcgtgag gaagatgata gttgtaggtc tgtggtgcat acaagtgatt ccgactgatc 1920
gaccaacaat gacgagagtc gtcgagatgt tggaaggaag cacaagtaat ctagagttgc 1980
cacccagagt tctcttgagc tga 2003
<210> 22
<211> 513
<212> PRT
<213> Zea mays
<220>
<221> misc_feature
<222> (64)..(64)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (88)..(88)
<223> Xaa can be any naturally occurring amino acid
<400> 22
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Xaa
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Xaa Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Leu Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Gly Ser Leu Pro Phe Lys Ser Glu Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ile His Pro Lys Arg
355 360 365
Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val Lys
370 375 380
Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His Asp
385 390 395 400
Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp Gly
405 410 415
Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His Val
420 425 430
Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg Ala
435 440 445
Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala Phe
450 455 460
Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu Phe
465 470 475 480
Asp Ile Ala Ile Gly Thr Arg Pro Glu Gly Ser Asn Thr Tyr Thr Gly
485 490 495
Asp Ala Thr Leu Gly Ser Cys Ile Leu Thr Ser Ser His Thr Thr Ser
500 505 510
Cys
<210> 23
<211> 2001
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of modified RLK1 allele from A188
<220>
<221> misc_feature
<222> (190)..(190)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (262)..(262)
<223> n is a, c, g, or t
<400> 23
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcn aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta cnccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttgtgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacatggt 1020
tcgctgccct tcaaatcgga gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta tacatccgaa aagatacacc tacgcggacg tgaaaagaat gacaaaatcc 1140
ttcgctgtga agctaggcca aggtgggttt ggtgctgtat acaaaggcag cctccacgat 1200
ggccgacagg tagcagtcaa gatgctcaag gacacccaag gtgacggcga ggaattcatg 1260
aacgaggtgg ctagcatcag caggacttct catgtcaacg tcgtgacact tctagggttt 1320
tgcttgcaag ggtcgaaaag agcactgatc tacgagtaca tgcccaatgg ttcgctcgaa 1380
aggtatgcct tcaccggtga catgaacagt gagaatttgc taacctggga aagactattt 1440
gacatagcaa ttggcacggc cagagggctc gaatacctac accggggatg caacactcgg 1500
atcgtgcatt ttgacatcaa gccacacaac atcctgttag accaggattt ctgccctaag 1560
atctctgact ttggactggc caagctatgt ctgaacaaag agagcgctat ctccattgct 1620
ggcgcaagag ggacgatagg gtatatcgcc ccggaggtct actcaaagca atttggaaca 1680
ataagcagca agtctgatgt ctatagctat gggatgatgg tccttgagat ggttggagca 1740
agggacagga atacaagcgc agatagtgac catagcagcc aatatttccc tcagtggctt 1800
tatgagcatt tggacgacta ttgtgttggt gcttccgaga ttaatggtga gaccacagag 1860
ctcgtgagga agatgatagt tgtaggtctg tggtgcatac aagtgattcc gactgatcga 1920
ccaacaatga cgagagtcgt cgagatgttg gaaggaagca caagtaatct agagttgcca 1980
cccagagttc tcttgagctg a 2001
<210> 24
<211> 666
<212> PRT
<213> Artificial Sequence
<220>
<223> modified RLK1 protein from A188
<220>
<221> misc_feature
<222> (64)..(64)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (88)..(88)
<223> Xaa can be any naturally occurring amino acid
<400> 24
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Xaa
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Xaa Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Leu Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Gly Ser Leu Pro Phe Lys Ser Glu Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ile His Pro Lys Arg
355 360 365
Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val Lys
370 375 380
Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His Asp
385 390 395 400
Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp Gly
405 410 415
Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His Val
420 425 430
Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg Ala
435 440 445
Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala Phe
450 455 460
Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu Phe
465 470 475 480
Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg Gly
485 490 495
Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile Leu
500 505 510
Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala Lys
515 520 525
Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg Gly
530 535 540
Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly Thr
545 550 555 560
Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu Glu
565 570 575
Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His Ser
580 585 590
Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr Cys
595 600 605
Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg Lys
610 615 620
Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp Arg
625 630 635 640
Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser Asn
645 650 655
Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 25
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> SYN14136 Primer Allele X
<400> 25
gaaggtgacc aagttcatgc tcatcttgtt cggccttttc tacacta 47
<210> 26
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> SYN14136 Primer Allele Y
<400> 26
gaaggtcgga gtcaacggat tatcttgttc ggccttttct acactc 46
<210> 27
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> SYN14136 Common Primer
<400> 27
agaaccaaaa attcaccagc tgtgagaa 28
<210> 28
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> PZE-108077560 Primer Allele X
<400> 28
gaaggtgacc aagttcatgc tgcagtggcc tgcgca 36
<210> 29
<211> 39
<212> DNA
<213> PZE-108077560 Primer Allele Y
<400> 29
gaaggtcgga gtcaacggat tgctgcagtg gcctgcgcg 39
<210> 30
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> PZE-108077560 Common Primer
<400> 30
agataatgag tcatcaggct atcagcaa 28
<210> 31
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> PZE-108093423 Primer Allele X
<400> 31
gaaggtgacc aagttcatgc tgtaatccat tgtgaacata tcgctatca 49
<210> 32
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> PZE-108093423 Primer Allele Y
<400> 32
gaaggtcgga gtcaacggat taatccattg tgaacatatc gctatcg 47
<210> 33
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> PZE-108093423 Common Primer
<400> 33
gaaacggttc tgctgcagtt tggta 25
<210> 34
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> MA0021 Primer Allele X
<400> 34
gaaggtgacc aagttcatgc tgagctcatc tcgtccaagc cc 42
<210> 35
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> MA0021 Primer Allele Y
<400> 35
gaaggtcgga gtcaacggat tgagctcatc tcgtccaagc cg 42
<210> 36
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> MA0021 Common Primer
<400> 36
cgctgcggtg ccgggtgat 19
<210> 37
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> MA0022 Primer Allele X
<400> 37
gaaggtgacc aagttcatgc tcaccaacac aatagtcgtc caaatgt 47
<210> 38
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> MA0022 Primer Allele Y
<400> 38
gaaggtcgga gtcaacggat taccaacaca atagtcgtcc aaatgc 46
<210> 39
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> MA0022 Common Primer
<400> 39
cagccaatat ttccctcagt ggctt 25
<210> 40
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> SYN4196 Primer Allele X
<400> 40
gaaggtgacc aagttcatgc tctgcactct ggaatatcta taacaga 47
<210> 41
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> SYN4196 Primer Allele Y
<400> 41
gaaggtcgga gtcaacggat tctgcactct ggaatatcta taacagc 47
<210> 42
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> SYN4196 Common Primer
<400> 42
tggtttatac caggaaggga cgcat 25
<210> 43
<211> 1395
<212> DNA
<213> Oryza sativa
<400> 43
tcgaggtcat tcatatgctt gagaagagag tcgggatagt ccaaaataaa acaaaggtaa 60
gattacctgg tcaaaagtga aaacatcagt taaaaggtgg tataaagtaa aatatcggta 120
ataaaaggtg gcccaaagtg aaatttactc ttttctacta ttataaaaat tgaggatgtt 180
tttgtcggta ctttgatacg tcatttttgt atgaattggt ttttaagttt attcgctttt 240
ggaaatgcat atctgtattt gagtcgggtt ttaagttcgt ttgcttttgt aaatacagag 300
ggatttgtat aagaaatatc tttaaaaaaa cccatatgct aatttgacat aatttttgag 360
aaaaatatat attcaggcga attctcacaa tgaacaataa taagattaaa atagctttcc 420
cccgttgcag cgcatgggta ttttttctag taaaaataaa agataaactt agactcaaaa 480
catttacaaa aacaacccct aaagttccta aagcccaaag tgctatccac gatccatagc 540
aagcccagcc caacccaacc caacccaacc caccccagtc cagccaactg gacaatagtc 600
tccacacccc cccactatca ccgtgagttg tccgcacgca ccgcacgtct cgcagccaaa 660
aaaaaaaaaa gaaagaaaaa aaagaaaaag aaaaaacagc aggtgggtcc gggtcgtggg 720
ggccggaaac gcgaggagga tcgcgagcca gcgacgaggc cggccctccc tccgcttcca 780
aagaaacgcc ccccatcgcc actatataca tacccccccc tctcctccca tccccccaac 840
cctaccacca ccaccaccac cacctccacc tcctcccccc tcgctgccgg acgacgagct 900
catcccccct ccccctccgc cgccgccgcg ccggtaacca ccccgcccct atcctctttc 960
tttctccgtt ttttttttcc gtctcggtct cgatctttgg ccttggtagt ttgggtgggc 1020
gagaggcggc ttcgtgcgcg cccagatcgg tgcgcgggag gggcgggatc tcgcggctgg 1080
ggctctcgcc ggcgtggatc cggcccggat ctcgcgggga atggggctct cggatgtaga 1140
tctgcgatcc gccgttgttg ggggagatga tggggggttt aaaatttccg ccatgctaaa 1200
caagatcagg aagaggggaa aagggcacta tggtttatat ttttatatat ttctgctgct 1260
tcgtcaggct tagatgtgct agatctttct ttcttctttt tgtgggtaga atttgaatcc 1320
ctcagcattg ttcatcggta gtttttcttt tcatgatttg tgacaaatgc agcctcgtgc 1380
ggagcttttt tgtag 1395
<210> 44
<211> 1883
<212> DNA
<213> Brachypodium distachyon
<400> 44
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag ttt 1883
<210> 45
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 73: G->A)
<400> 45
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccacccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 46
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 25: A->T)
<400> 46
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Thr His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 47
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 301: C->T)
<400> 47
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
tcgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 48
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 101: P->S)
<400> 48
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Ser Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 49
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 715: G->A)
<400> 49
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcatcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 50
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 239: V->I)
<400> 50
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Ile Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 51
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 862: T->A)
<400> 51
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga aatccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 52
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 288: F->I)
<400> 52
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Ile
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 53
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 929: A->G)
<400> 53
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaga aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 54
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 310: K->R)
<400> 54
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Arg Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 55
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 1289: C->T)
<400> 55
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggatt tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattgtgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 56
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 430: T->I)
<400> 56
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Ile Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Cys Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665
<210> 57
<211> 2004
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant Ht2 cDNA (position 1826: G->A)
<400> 57
atggctgctc acctaccacg cctccccgtc ctcctcctcg tcctcctcgc tgcccatgtc 60
gtctccacct ccgcccatgc cgagcctcct cttccgagcc cttacagcac ctccgcccat 120
ggcgagcctc ctcttccgag cacttacaac gtctccatgt gctcggaatc gttctggtgc 180
ggcggcgtcg aaatccgcta cccgttctat cttgccaacg caaccgccga ctacagcggg 240
agctactact cctgcggcta caccgacttg agcgtttcct gcaaactcga ggtcgagggg 300
ccgacgacga catggacccc taccatccgt ctcggcggcg acaactacac cgtcaagaac 360
atcttgtacg actatcatac catctcactg gcggacagcg atgtgctcgg aggcggcgag 420
tgccccgtcg tccaccacaa cgtcagcttc gacgagacgt ggctgcacaa ccccagcgcc 480
ttcgacaacc tcaccttctt cttcggatgc cactgggggc cacgcgatac actgcctgaa 540
tttgccggca acaacatcag ctgcgccggg ttcagtactc cagctatcag cggtggaggc 600
tccttcgtgt tcaagcctga agatcttgac gaacatgcgg agcaggagtt ggcttcacac 660
tgcgacgagg ttttctccgt gccagtgaga agcgaggctc tgcagcaggc gatcgtcagc 720
aacctcagcc tcggggacgg gtacggcgag ctgcttaggc aggggatcga gttggaatgg 780
aaacggacat cggaggatca gtgtggccag tgcgaggaat cgggctccgg cggacggtgc 840
gcctacagcc agaagagaga attccttggc tgcttctgca gcggagggaa ggcgggcaac 900
ccgttctgca aaccatcaag atcaacaaaa aggagagaag cagcatctat tgttggtgct 960
gttgccgttg cattcctgtg tctagtcatt ctcacatgct tcttggcttg tagacattgt 1020
tcgctgccct tcaaatcgaa gaacaaacca gggacaagga ttgagtcctt cctacagaag 1080
aacgagagta gtatacatcc gaaaagatac acctacgcgg acgtgaaaag aatgacaaaa 1140
tccttcgctg tgaagctagg ccaaggtggg tttggtgctg tatacaaagg cagcctccac 1200
gatggccgac aggtagcagt caagatgctg aaggacaccc aaggtgacgg cgaggaattc 1260
atgaacgagg tggctagcat cagcaggact tctcatgtca acgtcgtgac acttctaggg 1320
ttttgcttgc aagggtcgaa aagagcactg atctacgagt acatgcccaa tggttcgctc 1380
gaaaggtatg ccttcaccgg tgacatgaac agtgagaatt tgctaacctg ggaaagacta 1440
tttgacatag cgattggcac ggccagaggg ctcgaatacc tacaccgggg atgcaacact 1500
cggatcgtgc attttgacat caagccacac aacatcctgt tagaccagga tttctgccct 1560
aagatctctg actttggact ggccaagcta tgtctgaaca aagagagcgc tatctccatt 1620
gctggcgcaa gagggacgat agggtatatc gccccggagg tctactcaaa gcaatttgga 1680
acgatcagca gcaagtctga tgtctatagc tatgggatga tggtccttga gatggttgga 1740
gcaagggaca ggaatacaag cgcagatagt gaccatagca gccaatattt ccctcagtgg 1800
ctttatgaac atttggacga ctattatgtt ggtgcttccg agattaatgg tgagaccaca 1860
gagctcgtga ggaagatgat agttgtaggt ctgtggtgca tacaagtgat tccgactgat 1920
cgaccaacaa tgacgagagt cgtcgagatg ttggaaggaa gcacaagtaa tctagagttg 1980
ccacccagag ttctcttgag ctga 2004
<210> 58
<211> 667
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant Ht2 protein (position 609: C->Y)
<400> 58
Met Ala Ala His Leu Pro Arg Leu Pro Val Leu Leu Leu Val Leu Leu
1 5 10 15
Ala Ala His Val Val Ser Thr Ser Ala His Ala Glu Pro Pro Leu Pro
20 25 30
Ser Pro Tyr Ser Thr Ser Ala His Gly Glu Pro Pro Leu Pro Ser Thr
35 40 45
Tyr Asn Val Ser Met Cys Ser Glu Ser Phe Trp Cys Gly Gly Val Glu
50 55 60
Ile Arg Tyr Pro Phe Tyr Leu Ala Asn Ala Thr Ala Asp Tyr Ser Gly
65 70 75 80
Ser Tyr Tyr Ser Cys Gly Tyr Thr Asp Leu Ser Val Ser Cys Lys Leu
85 90 95
Glu Val Glu Gly Pro Thr Thr Thr Trp Thr Pro Thr Ile Arg Leu Gly
100 105 110
Gly Asp Asn Tyr Thr Val Lys Asn Ile Leu Tyr Asp Tyr His Thr Ile
115 120 125
Ser Leu Ala Asp Ser Asp Val Leu Gly Gly Gly Glu Cys Pro Val Val
130 135 140
His His Asn Val Ser Phe Asp Glu Thr Trp Leu His Asn Pro Ser Ala
145 150 155 160
Phe Asp Asn Leu Thr Phe Phe Phe Gly Cys His Trp Gly Pro Arg Asp
165 170 175
Thr Leu Pro Glu Phe Ala Gly Asn Asn Ile Ser Cys Ala Gly Phe Ser
180 185 190
Thr Pro Ala Ile Ser Gly Gly Gly Ser Phe Val Phe Lys Pro Glu Asp
195 200 205
Leu Asp Glu His Ala Glu Gln Glu Leu Ala Ser His Cys Asp Glu Val
210 215 220
Phe Ser Val Pro Val Arg Ser Glu Ala Leu Gln Gln Ala Ile Val Ser
225 230 235 240
Asn Leu Ser Leu Gly Asp Gly Tyr Gly Glu Leu Leu Arg Gln Gly Ile
245 250 255
Glu Leu Glu Trp Lys Arg Thr Ser Glu Asp Gln Cys Gly Gln Cys Glu
260 265 270
Glu Ser Gly Ser Gly Gly Arg Cys Ala Tyr Ser Gln Lys Arg Glu Phe
275 280 285
Leu Gly Cys Phe Cys Ser Gly Gly Lys Ala Gly Asn Pro Phe Cys Lys
290 295 300
Pro Ser Arg Ser Thr Lys Arg Arg Glu Ala Ala Ser Ile Val Gly Ala
305 310 315 320
Val Ala Val Ala Phe Leu Cys Leu Val Ile Leu Thr Cys Phe Leu Ala
325 330 335
Cys Arg His Cys Ser Leu Pro Phe Lys Ser Lys Asn Lys Pro Gly Thr
340 345 350
Arg Ile Glu Ser Phe Leu Gln Lys Asn Glu Ser Ser Ile His Pro Lys
355 360 365
Arg Tyr Thr Tyr Ala Asp Val Lys Arg Met Thr Lys Ser Phe Ala Val
370 375 380
Lys Leu Gly Gln Gly Gly Phe Gly Ala Val Tyr Lys Gly Ser Leu His
385 390 395 400
Asp Gly Arg Gln Val Ala Val Lys Met Leu Lys Asp Thr Gln Gly Asp
405 410 415
Gly Glu Glu Phe Met Asn Glu Val Ala Ser Ile Ser Arg Thr Ser His
420 425 430
Val Asn Val Val Thr Leu Leu Gly Phe Cys Leu Gln Gly Ser Lys Arg
435 440 445
Ala Leu Ile Tyr Glu Tyr Met Pro Asn Gly Ser Leu Glu Arg Tyr Ala
450 455 460
Phe Thr Gly Asp Met Asn Ser Glu Asn Leu Leu Thr Trp Glu Arg Leu
465 470 475 480
Phe Asp Ile Ala Ile Gly Thr Ala Arg Gly Leu Glu Tyr Leu His Arg
485 490 495
Gly Cys Asn Thr Arg Ile Val His Phe Asp Ile Lys Pro His Asn Ile
500 505 510
Leu Leu Asp Gln Asp Phe Cys Pro Lys Ile Ser Asp Phe Gly Leu Ala
515 520 525
Lys Leu Cys Leu Asn Lys Glu Ser Ala Ile Ser Ile Ala Gly Ala Arg
530 535 540
Gly Thr Ile Gly Tyr Ile Ala Pro Glu Val Tyr Ser Lys Gln Phe Gly
545 550 555 560
Thr Ile Ser Ser Lys Ser Asp Val Tyr Ser Tyr Gly Met Met Val Leu
565 570 575
Glu Met Val Gly Ala Arg Asp Arg Asn Thr Ser Ala Asp Ser Asp His
580 585 590
Ser Ser Gln Tyr Phe Pro Gln Trp Leu Tyr Glu His Leu Asp Asp Tyr
595 600 605
Tyr Val Gly Ala Ser Glu Ile Asn Gly Glu Thr Thr Glu Leu Val Arg
610 615 620
Lys Met Ile Val Val Gly Leu Trp Cys Ile Gln Val Ile Pro Thr Asp
625 630 635 640
Arg Pro Thr Met Thr Arg Val Val Glu Met Leu Glu Gly Ser Thr Ser
645 650 655
Asn Leu Glu Leu Pro Pro Arg Val Leu Leu Ser
660 665

Claims (6)

1.核酸分子,其由选自由以下组成的组的核苷酸序列组成:(a)SEQ ID NO:1或SEQ IDNO:2所示的核苷酸序列;(b)编码SEQ ID NO:3所示氨基酸序列的核苷酸序列;其中所述核酸分子编码多肽,所述多肽能够在表达所述多肽的植物中赋予或增加对由大斑病长蠕孢(Helminthosporium turcicum) 小种0、1和N引起的植物病害的抗性。
2.载体或表达盒,其包含权利要求1的核酸分子,可操作地连接至允许核苷酸序列在植物细胞中表达的启动子。
3.多肽,其由权利要求1的核酸分子编码。
4.在植物中增加对由大斑病长蠕孢(Helminthosporium turcicum) 小种0、1和N引起的植物病害的抗性的方法,包括以下步骤:(a)将权利要求1的核酸分子或权利要求2的载体或表达盒引入植物的至少一个细胞中,(b)从所述至少一个细胞再生植物,以及(c)使所述核酸分子在植物中表达。
5.用于在植物中检测权利要求1的核酸分子的存在或不存在的方法,其包括以下步骤:(a)从所述植物的至少一个细胞中分离DNA,和(b)使用分子标记检测权利要求1的核酸分子的存在或不存在,其中所述分子标记选自PZE-108077560、PZE-108093423、MA0021和MA0022;和
(c) 鉴定或选择具有对由大斑病长蠕孢(Helminthosporium turcicum) 小种0、1和N引起的植物病害的增加的抗性且包含权利要求1的核酸分子的植物,其中所述分子标记PZE-108077560位于参考基因组AGPv02的133189880位且可通过SEQ ID NO:28-30的引物检测,所述分子标记PZE-108093423位于参考基因组AGPv02的150279048位且可通过SEQ IDNO:31-33的引物检测,所述分子标记MA0021位于参考基因组AGPv02的151907173位且可通过SEQ ID NO:34-36的引物检测,所述分子标记MA0022位于参考基因组AGPv02的152046529位且可通过SEQ ID NO:37-39的引物检测。
6.用于鉴定对由大斑病长蠕孢(Helminthosporium turcicum) 小种0、1和N引起的植物病害具有增加的抗性并且内源地包含权利要求1的核酸分子的植物的方法,所述方法包括在植物中检测至少两个标记的等位基因,其中至少一个所述标记在SYN14136和权利要求1的核酸分子之间的染色体区间内,并且至少一个所述标记在权利要求1的核酸分子和SYN4196之间的染色体区间内,其中所述SYN14136位于参考基因组AGPv02的131681497位且可通过SEQ ID NO:25-27的引物检测,且所述SYN4196位于参考基因组AGPv02的161766769位且可通过SEQ ID NO:40-42的引物检测,其中所述标记选自PZE-108077560、PZE-108093423、MA0021和MA0022,其中所述标记PZE-108077560位于参考基因组AGPv02的133189880位且可通过SEQ ID NO:28-30的引物检测,所述标记PZE-108093423位于参考基因组AGPv02的150279048位且可通过SEQ ID NO:31-33的引物检测,所述标记MA0021位于参考基因组AGPv02的151907173位且可通过SEQ ID NO:34-36的引物检测,所述标记MA0022位于参考基因组AGPv02的152046529位且可通过SEQ ID NO:37-39的引物检测。
CN201880068589.5A 2017-08-22 2018-08-22 赋予对真菌病原体抗性的基因 Active CN111247244B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP17187309.4 2017-08-22
EP17187309.4A EP3447134B1 (en) 2017-08-22 2017-08-22 Increased fungal resistance in crop plants
EP17206305.9 2017-12-08
EP17206305.9A EP3447135A1 (en) 2017-08-22 2017-12-08 Gene conferring resistance to fungal pathogen
PCT/EP2018/072665 WO2019038326A1 (en) 2017-08-22 2018-08-22 GENE CONFERRING RESISTANCE TO A FUNGAL PATHOGEN

Publications (2)

Publication Number Publication Date
CN111247244A CN111247244A (zh) 2020-06-05
CN111247244B true CN111247244B (zh) 2024-04-16

Family

ID=59686805

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880068589.5A Active CN111247244B (zh) 2017-08-22 2018-08-22 赋予对真菌病原体抗性的基因
CN201880068564.5A Pending CN111247243A (zh) 2017-08-22 2018-08-22 在作物植物中增加的真菌抗性

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201880068564.5A Pending CN111247243A (zh) 2017-08-22 2018-08-22 在作物植物中增加的真菌抗性

Country Status (11)

Country Link
US (3) US20210071194A1 (zh)
EP (4) EP3447134B1 (zh)
CN (2) CN111247244B (zh)
AR (2) AR112863A1 (zh)
BR (1) BR112020003336A2 (zh)
CA (2) CA3073467A1 (zh)
CL (1) CL2020000418A1 (zh)
EA (1) EA202090540A1 (zh)
PH (1) PH12020500361A1 (zh)
WO (2) WO2019038339A1 (zh)
ZA (1) ZA202001047B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108588087B (zh) * 2018-05-16 2022-06-03 南京农业大学 一种提高植物抗病性的基因GmLecRK-R及其应用
CN110564813A (zh) * 2019-09-25 2019-12-13 青海大学 一种与青稞条纹病相关的miRNAs及其挖掘方法
CN110699357B (zh) * 2019-11-08 2021-02-12 山东农业大学 纹枯病菌微小rna、其对玉米基因的调控作用及其应用
WO2022013268A1 (en) 2020-07-14 2022-01-20 KWS SAAT SE & Co. KGaA Methods for identifying and selecting maize plants with resistance to northern corn leaf blight
CN112852829B (zh) * 2020-12-19 2022-07-08 河南农业大学 小麦茎基腐病相关基因TaDIR-B1及其应用
CN113403308B (zh) * 2020-12-25 2022-10-21 华南农业大学 一种提高水稻抗白叶枯病的方法
EP4108076A1 (en) 2021-06-22 2022-12-28 KWS SAAT SE & Co. KGaA Enhanced disease resistance of maize to northern corn leaf blight by a qtl on chromosome 4
CN115058533A (zh) * 2022-06-06 2022-09-16 吉林省白城市农业科学院(吉林省向日葵研究所) 用于燕麦茎中基因表达分析的内参基因及应用
CN116024234B (zh) * 2022-12-12 2023-07-21 南京林业大学 一种杨树壳针孢菌效应蛋白SmCSEP3及其应用
CN116406590B (zh) * 2023-03-31 2023-12-22 东北农业大学 一种利用片段化番茄esDNA提高番茄植株抗性、防治灰霉病的方法及应用
CN117413738B (zh) * 2023-12-19 2024-03-22 中国农业科学院农业资源与农业区划研究所 一种用于镉污染稻田土壤的水稻安全生产方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011163590A1 (en) * 2010-06-25 2011-12-29 E. I. Du Pont De Nemours And Company Compositions and methods for enhancing resistance to northern leaf blight in maize
CN105705005A (zh) * 2013-09-04 2016-06-22 Kws种子欧洲股份公司 大斑病长蠕孢抗性植物
CN109844121A (zh) * 2016-10-13 2019-06-04 先锋国际良种公司 产生北方叶枯病抗性玉蜀黍

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6466398A (en) * 1997-03-13 1998-09-29 Dekalb Genetics Corporation Maize dimboa biosynthesis genes
CA2350398C (en) 1998-11-12 2010-08-10 Max-Planck-Gesellschaft Zur Foerderung Der Wissenschaften E.V. Chimeric promoters capable of mediating gene expression in plants upon pathogen infection and uses thereof
DE102006029129A1 (de) 2006-06-22 2007-12-27 Kws Saat Ag Pathogen induzierbarer synthetischer Promotor
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
SG181601A1 (en) 2009-12-10 2012-07-30 Univ Minnesota Tal effector-mediated dna modification
WO2017066597A1 (en) * 2015-10-16 2017-04-20 Pioneer Hi-Bred International, Inc. Generating maize plants with enhanced resistance to northern leaf blight

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011163590A1 (en) * 2010-06-25 2011-12-29 E. I. Du Pont De Nemours And Company Compositions and methods for enhancing resistance to northern leaf blight in maize
CN102958349A (zh) * 2010-06-25 2013-03-06 纳幕尔杜邦公司 用于在玉米中增强玉米大斑病抗性的组合物和方法
CN105705005A (zh) * 2013-09-04 2016-06-22 Kws种子欧洲股份公司 大斑病长蠕孢抗性植物
CN109844121A (zh) * 2016-10-13 2019-06-04 先锋国际良种公司 产生北方叶枯病抗性玉蜀黍

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ping Yang 等.Alleles of a wall-assocoated kinase gene account for three of the major northern corn leaf blight resistance loci in maize.The Plant journal: for cell and molecular biology.2021,第106卷(第2期),第526-535页. *

Also Published As

Publication number Publication date
WO2019038326A1 (en) 2019-02-28
EA202090540A1 (ru) 2020-05-28
EP3447134A1 (en) 2019-02-27
EP3447135A1 (en) 2019-02-27
US20230021982A1 (en) 2023-01-26
EP3447134B1 (en) 2023-10-11
CN111247244A (zh) 2020-06-05
CL2020000418A1 (es) 2020-07-10
ZA202001047B (en) 2021-04-28
CA3073467A1 (en) 2019-02-28
PH12020500361A1 (en) 2021-01-25
WO2019038339A1 (en) 2019-02-28
AR112863A1 (es) 2019-12-26
US20210071194A1 (en) 2021-03-11
BR112020003336A2 (pt) 2020-08-25
CA3073306A1 (en) 2019-02-28
EP3673051A1 (en) 2020-07-01
CN111247243A (zh) 2020-06-05
EP3673052A1 (en) 2020-07-01
US20200231984A1 (en) 2020-07-23
AR113167A1 (es) 2020-02-05

Similar Documents

Publication Publication Date Title
CN111247244B (zh) 赋予对真菌病原体抗性的基因
CN110494039B (zh) 修饰菠菜对霜霉病的抗性谱的方法
US11299746B2 (en) Disease resistant pepper plants
US10988775B2 (en) Wheat plants resistant to powdery mildew
US20190144878A1 (en) Disease resistant brassica plants
CN113874388A (zh) 孤雌生殖基因
US9732354B2 (en) Plant resistance gene
CN107759676B (zh) 一种植物直链淀粉合成相关蛋白Du15与其编码基因及应用
CN114641572A (zh) 来自香蕉的野生近缘种的抗性基因的鉴定及其在控制巴拿马病中的用途
US20230054527A1 (en) Enhanced disease resistance of maize to northern corn leaf blight by a qtl on chromosome 4
CN108795949B (zh) 一种水稻叶色调控相关基因OsWSL6及其编码蛋白质和应用
CN115216554A (zh) 植物病原体效应子和疾病抗性基因鉴定、组合物和使用方法
AU2017232723B2 (en) Modulating plant abiotic stress responses using the kanghan gene family
CN101157927A (zh) 水稻抗病相关基因OsDR10和它在水稻抗病中的应用
EP4108076A1 (en) Enhanced disease resistance of maize to northern corn leaf blight by a qtl on chromosome 4
WO2019018895A1 (en) HORIZONTAL TRANSFER OF FUNGAL GENES IN PLANTS
CN110959043A (zh) 利用bcs1l基因和向导rna/cas核酸内切酶系统改良植物农艺性状的方法
US11859196B2 (en) Modulating drought tolerance in Brassicaceae using the Kanghan gene family
JP2008054532A (ja) アルミニウム耐性に関与する遺伝子、およびその利用
CN116249445A (zh) 鉴定和选择抗玉米大斑病的玉米植物的方法
CN114085275A (zh) 一种mate家族基因及其编码蛋白在增强植物百草枯抗性的应用
CA3132694A1 (en) Overcoming self-incompatibility in diploid plants for breeding and production of hybrids through modulation of ht
Kang et al. Rapid and Unequivocal Identification Method for Event-specific Detection of Transgene Zygosity in Genetically Modified Chili Pepper

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant